量子位

量子位

关注
17.6万粉丝
0关注
9.7万被推荐

《量子位》官方网易号

5枚勋章

2次获得编辑精选

追踪人工智能动态
IP属地:北京
更多信息

  • 神秘「欢乐马」霸榜视频模型!本以为Seedance2.0已封神…
    5小时前
    1跟贴
  • 最近半年来,受到AI需求的强烈影响,内存价格已经翻了一倍不止。现在我们买不起的内存条,再过几年可能就会消失,被一种全新的形态(CAMM)代替。
    行业密探
  • 人类用了30年内存条,快“死了”吗?

    6小时前
    图片
    08:59

  • 今早,Anthropic发布了最新Agent架构Managed Agents。 一并公布的技术文档中反复强调“Agent Harness”这个关键概念,其核心是: 每个Agent请求都应该跑在独立的沙盒环境里。 顺着这条思路深挖,我们发现,已经有一个产品因同样的架构设计冲上了热搜Top 3。 这款产品叫CREAO,由一支硅谷华人团队打造。 在正式了解CREAO之前,我们先来浅聊两句AI Agent Harness。 Harness绝对是近期大模型世界里最热的词(也被戏称为继token后又一难翻译成中文的AI名词)。 它指代的是让AI能持续可靠地大规模长期工作的外围控制系统,包括提示词构建、工具调用、状态管理、安全检查和循环控制等等。 由于AI技术日益进化,AI产品强调从“Chatbot”转变向“可靠的Agent”,Harness的重要性也日益提升。 而随着AI从专业开发者走向普通大众,是时候出现一款消费级的AI Agent Harness了。 CREAO应运而生。 甫一上线,CREAO就用评论区五花八门的买家秀展示了自己是如何面向普通用户大展拳脚的。 有人用它搭了一套全自动竞品监控,每周一定时抓取价格,自动发到工作群;有人把图像生成、配音、转录、剪辑一整条内容流水线交给它,设置好之后,就再也没有手动操作过…… 凭借从配置到使用0门槛、高稳定性等独特能力,CREAO的热度一路从北美蔓延到欧洲、东南亚、拉美,并迅速引发全球数十位科技KOL的注意。 大家隔着网线,来了场浩浩荡荡的跨语种深度评测。 量子位获悉,CREAO背后是一支位于硅谷的中美复合型团队。 他们秉承着一个朴素的核心判断:让普通人只用花费说句话的力气,就能搭建一个属于自己的、永不停歇的Agent。
    行业密探
  • Anthropic发布Managed Agents,才发现有硅谷华人团队早就押对了

    7小时前
    2跟贴
    图片
  • 爆火GitHub!《生化危机》女主打造免费“AI记忆系统”
    9小时前
    5跟贴

  • 马斯克连赔偿款都不要了,现在状告OpenAI只有一个核心诉求: 把奥特曼从OpenAI非营利母公司董事会除名。 老马刚刚对OpenAI诉讼作出修订,提出如果胜诉,所有赔偿一分不要,全部捐给OpenAI旗下的非营利机构,只要把奥特曼赶走就行。 连带OpenAI总裁Greg Brockman也被要求交出所有股权收益。 马斯克本人转发了相关报道。 这下连xAI和OpenAI的商业竞争也顾不上了,就追着奥特曼锤。
    行业密探
  • 马斯克死磕奥特曼:赔款我不要,但他必须离开OpenAI董事会

    11小时前
    图片

  • 再见了,所有的羊驼。 亚历山大王带队9个月从零重构Meta所有AI技术栈,在不断的质疑中交出超级智能实验室第一个模型: 主打原生多模态的Muse Spark。 随手一扒你就会发现,这款模型背后藏着不少我们熟悉的高手:思维链作者Jason Wei、o1核心贡献者Hyung Won Chung、被小扎天价挖来的余家辉、扩散模型核心人物宋飏…… 嗯?当这群人凑在一起,很明显你就会找到一个关键词:推理。 没错,据Jason Wei爆料,9个月前他们坐在一起讨论时,首先写下的就是一款用于推理的llama模型脚本,而现在,完全体终于诞生。 而顶尖高手+耗时9个月打磨,Muse Spark也总算让Meta在第三方测评中赶上第一梯队,一雪llama 4带来的前耻。 而且很有意思的一点是,Meta这次一反常态,没有反复强调自己拿了多少SOTA,而是稍显克制地表示: Muse Spark在多模态感知、推理、健康和自主任务方面表现不错,但在编程和长时间自主运行方面仍与对家的顶尖模型存在差距。 咳咳,看来之前llama 4确实给Meta留下了心理阴影(doge)。 另外,Muse Spark的出生也终于让长期以来有关“Meta开闭源”的讨论盖棺定论: 这次是真闭源了。 目前这款模型已上线Meta网站和APP,API仅向部分合作伙伴开放。 (不过亚历山大王还是留了个口子,表示“计划未来开源后续版本”)
    行业密探
  • Meta亿元天团首个大模型交卷!耗时九个月,一雪Llama前耻
    12小时前
    5跟贴
  • AIGC的出现看似降低了门槛,但数据表达对科学性和准确性是“零容忍”的。AI幻觉导致的计算错误或逻辑错位,使得其生成的图表可用性极低。
    为了解决这一行业痛点,武汉大学王琼教授团队亮出了他们的方案:爱图表(Aitubiao.com),据悉是“全球首个AI图表智能体”。 武大文科教授硬核跨界AI:半年项目量猛涨4000%,重构AI图表生产力
    行业密探
  • 武大文科教授硬核跨界AI:半年项目量猛涨4000%,重构图表生产力
    1天前
    1跟贴
  • Generalist最新长文定调:具身原生才是正道,原力灵机已交卷

    1天前
    图片
  • Nature Index特刊以复杂系统为理论基础的“天立学科大脑”

    1天前
    图片

  • 优化CUDA Kernel这件事,刚刚被AI狠狠地冲击了一波。 因为现在,给AI十四个小时,它就能帮你把CUDA Kernel优化,加速比从2.6×推至35.7×! 什么概念? 以前人类资深CUDA工程师要完成这个任务,需要数月反复测试、调优、推翻重来才行;但现在,AI在你睡觉的时候就能解决掉。 而且AI在这个过程中还展现出了专家级的直觉。 例如在优化初期,它尝试在现有高层框架内寻找解法,但很快通过自主跑测试发现性能触及了天花板,然后它便做出了人类专家才有的决策—— 自主判断放弃高层框架,直接转向底层C++进行硬核重写。 整整14个小时里,这个AI主打一个全自动:AI自己发现瓶颈,自己改变技术栈,自己重新编译,自己测试。 那这到底是何许AI是也? 不卖关子,正是大家熟悉的,来自智谱的开源模型——GLM-5.1。 随着这次长程任务(Long Horizon Task)能力的提升,智谱官方也宣布了一个重要的突破: 首次解锁了开源模型与当前全球最顶尖闭源模型Claude Opus 4.6的全面对齐! 嗯,是妥妥稳坐全球最强开源模型宝座的感觉了。 而且,从更多的权威评测榜单中来看,也是印证了这一点。 在被称为“软件工程能力试金石”的SWE-bench Pro基准测试中,GLM-5.1刷新了全球最佳成绩,直接超越Claude Opus 4.6、GPT-5.4等一众头部模型,拿下全球第一:【图2】。 甚至在海外网友们的圈子中,已经吹起了弃用Claude Max的风了:它的手感和Opus一模一样,使用额度是Claude Code的3倍,成本却只有1/3。【图3】 HuggingFace CEO也出面站台,称SWE-Bench Pro中性能最强的模型开源了:【图4】。 而这一切成绩的背后,正是智谱面向小时级的长程任务能力。
    行业密探
  • 地瓜机器人再获1.5亿美元投资!B轮累计融资2.7亿美元

    1天前
    图片
  • 开源模型首超Opus4.6!智谱GLM-5.1登场,14小时后CUDA专家被冲了

    1天前
    22跟贴
    图片
  • 国产免费2B开源语音模型征服《莽撞人》!复刻郭德纲最难贯口

    1天前
    2跟贴
    图片
  • 智象未来联手诺亦腾机器人,年内造数万小时训练数据

    1天前
    图片
    02:39
  • AI谄媚可能让人陷入妄想症

    1天前
    图片
    01:11
正在载入...
正在载入...