登顶HuggingFace日榜!γ-World:把世界模型从单机打到联机
薅完你家薅你家!GitHub 5.7K星,用它白嫖十几亿Token?
CVPR | LoRA遇上RoPE!WaDi:面向单步图像生成权重方向感知蒸馏
刚刚,智元拿下WorldArena世界模型总分冠军!
力量 精度 灵活性 这只手全包了
阶跃发布Step 3.7 Flash-1
阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型
DiffusionOPD:复旦联合通义万相提出扩散模型在线策略蒸馏新范式
Opus 蒸馏了千问?
超越TurboQuant,长上下文推理真2-bit KV Quantization算法问世
登顶HuggingFace日榜!γ-World:把世界模型从单机打到联机
CVPR | LoRA遇上RoPE!WaDi:面向单步图像生成权重方向感知蒸馏
刚刚,智元拿下WorldArena世界模型总分冠军!
阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型
DiffusionOPD:复旦联合通义万相提出扩散模型在线策略蒸馏新范式
超越TurboQuant,长上下文推理真2-bit KV Quantization算法问世
消耗1830亿token,Meta用AI把数学教材翻译成了一个超大Lean库
「马嘉祺」让大模型翻车,而他一年前洗澡时就发现了问题
千寻智能高阳团队提出Legato,入选RSS 2026
Claude Opus 4.8问世,Anthropic估值暴涨至9650亿美元
国产超算生成式压缩模型训练性能突破2.16 EFLOP/s
谷歌AI不认识Google
别在CVPR独自社恐!丹佛AI Talent Meetup,聊你听得懂的技术与理想
Google新数据集首次大规模捕捉用户「未言明的想法」
AutoMoT : B2D & nuScense双SOTA ,重新思考VLM和端到端驾驶结合
多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL
刚刚,国产预训练具身大模型开源了,让后训练不再是必选项!
全球首次单机降服万亿巨模DeepSeek-V4!RL后训练框架Orbit开源!
外媒:黄仁勋加入清华大学,任职经管学院顾问
Speech LLM 的下一个突破口:语音大模型可以是带韵律的文本模型