机器之心Pro

机器之心Pro

关注
14.3万粉丝
1关注
1.4万被推荐

《机器之心》官方网易号

3枚勋章

专业的人工智能媒体
IP属地:河北
更多信息

  • 登顶HuggingFace日榜!英伟达清华团队γ-World:把世界模型从单机打到联机 登顶HuggingFace日榜!γ-World:把世界模型从单机打到联机
    行业密探
  • 登顶HuggingFace日榜!γ-World:把世界模型从单机打到联机

    16小时前
    图片
  • GitHub 上有个 5.9k star 的开源项目
    彻底终结到处切 API、满世界找免费额度的苦日子 狂薅个十几亿 token,一起来看看怎么回事?
    行业密探
  • 薅完你家薅你家!GitHub 5.7K星,用它白嫖十几亿Token?

    17小时前
    图片
    01:27
  • CVPR | LoRA遇上RoPE!WaDi:面向单步图像生成权重方向感知蒸馏

    1天前
    图片
  • 南开大学 PCA Lab 团队分析了单步学生模型与多步教师模型之间 U-Net/DiT 权重的变化规律。分析表明,权重方向上的变化显著超过权重范数上的变化,这揭示了方向是蒸馏过程中的关键因素。受此启发,团队提出了权重方向低秩旋转(Low-rank Rotation of weight Direction,LoRaD)—— 一种专为单步扩散蒸馏设计的参数高效适配器。 CVPR 2026|当LoRA遇上RoPE!WaDi:面向单步图像生成权重方向感知蒸馏
    行业密探
  • WorldArena 世界模型赛道从来都是竞争异常激烈,在经历了前几次比赛过程中的放榜之后,CVPR 2026 WorldArena 世界模型赛道锁定总成绩,智元自研的世界模型 Genie Envisioner-Sim 2.0(以下简称 GE 2.0)拿下了最终的冠军,成为了 “强者中的强者”。 刚刚,智元拿下WorldArena世界模型总分冠军!
    行业密探
  • 刚刚,智元拿下WorldArena世界模型总分冠军!

    1天前
    图片
  • 灵巧手行业迎来革新派,
    行业密探
  • 力量 精度 灵活性 这只手全包了

    1天前
    图片
    01:01
  • 阶跃发布Step 3.7 Flash-1

    1天前
    图片
    01:21
  • 阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型

    1天前
    图片
  • 继 Step 3.5 Flash 后,阶跃星辰最近又推出新一代高效率 Flash 开源模型 ——Step 3.7 Flash。
    该模型最大特点就是多(模)、快(速)、好(用)、省(钱)。总参数 196B,采用稀疏 MoE 架构,推理激活参数仅 11B,配备 1.88B ViT 视觉编码器,推理速度最高 400 TPS,支持 256K 上下文。 阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型
    行业密探
  • 近期,来自复旦大学与阿里巴巴通义万相的研究团队对此提出了新的思考。他们认为,多任务强化学习不应被视为一个统一优化问题,而应该解耦为两个彼此独立的过程:单任务的在线策略探索 & 多任务能力整合。 DiffusionOPD:复旦联合通义万相提出扩散模型「在线策略蒸馏」新范式
    行业密探
  • Anthropic发布了全网最“诚实”的模型:Opus 4.8,随之公布的还有这份244页的超级详细报告,堪称目前最透明的AI安全报告!
    行业密探
  • DiffusionOPD:复旦联合通义万相提出扩散模型在线策略蒸馏新范式

    1天前
    1跟贴
    图片
  • Opus 蒸馏了千问?

    1天前
    图片
    01:31
  • 超越 TurboQuant,内存有救了!TogetherAI 最新论文 OSCAR 直面冲击 TurboQuant,提出一个面向长上下文推理服务的真正的 2-bit KV Cache 系统,开盒即用。 面向长上下文推理的真2-bit KV Quantization算法问世
    行业密探
  • 超越TurboQuant,长上下文推理真2-bit KV Quantization算法问世

    1天前
    图片
  • 这件事因为明星效应迅速出圈,全网热议。但其实这件事的技术原因早有端倪。低频 token 退化,并不完全是一个全新的技术发现。 「马嘉祺」让大模型翻车,而他一年前洗澡时就发现了问题
    行业密探
正在载入...
正在载入...