打开网易新闻 查看精彩图片

整理:晓睿等

1、Midjourney 进军硬件领域,不务正业还是另辟蹊径

知名 AI 图像生成公司在社交媒体 X 上发布消息,宣布将扩展其业务范围,邀请人才加入其新成立的硬件部门。「Midjourney」尚未透露将开发何种类型的硬件设备,但表示有多个项目正在进行中,并暗示有「更多形态的可能性」。

「Midjourney」创始人 David Holz 曾任 Leap Motion 首席技术官,拥有丰富的硬件经验。近期,Holz 招募了前 Leap Motion 同事 Ahmad Abbas 担任硬件部门负责人,Abbas 在苹果公司工作五年,参与了 Vision Pro 头显的研发。「Midjourney」是探索 AI 驱动硬件领域的公司之一,其新产品备受行业期待。

打开网易新闻 查看精彩图片

快评:Midjourney虽然仍是当下AI绘画领域的排头兵,但后起之秀如FLUX、Ideogram以及国内的秒画等,都有超越的架势。尤其ComfyUI 爆红之后,AI绘画进入工作流编排时代,ComfyUI显然比只能用Prompt生成图片的Midjourney更能解决专业领域人员精细化绘画的需求。

Midjourney也不像SD公司那样动荡,这一年技术产品上却没啥大动作,简直匪夷所思。当然,Midjourney现在向所有用户免费开放了,每天都可以生成25张高质量的图片,如果只是好奇党完全不用再花钱。鲸哥想起当初花了600多人民币冲的一年会员,默默流下了眼泪。

2、智谱 AI 开放视频通话,6小虎之首不服输

9 月 5 日消息,中关村科学城公司在公众号发文,宣布以投前 200亿元估值领投智谱华章新一轮融资,用于支持智谱华章国产基座大模型的技术创新与生态发展。

打开网易新闻 查看精彩图片

公开信息显示,这是智谱在 2024 年完成的第三轮融资。目前,智谱的股东名单中已经包括了高瓴资本、启明创投、君联资本等知名投资机构,以及美团、阿里巴巴、腾讯、小米等互联网巨头。

同期,智谱 AI 宣布,上线大语言模型GLM-4-Plus;图像和视频理解模型GLM-4V-Plus;AI绘图图模型CogView-3-Plus;智谱清言上线“视频通话”,一连串重要更新。

快评:最近大模型6小虎的传言较多,比如智谱不敢发力C端应用,以及高管内斗等等。智谱确实主要做To B,其中政府商单也确实不是那么好做,鲸哥听闻智谱和某企业服务公司联合做的大模型政务商用公司一些情况。但对于智谱来说,这次融资和新品发布,还是让其短时间具备充足的粮草和技术储备,迎接未来两三年的大模型淘汰赛。

3、腾讯推出新一代大模型混元 Turbo,后来者如何超越先发者

9 月 5 日,腾讯 宣布推出新一代大模型混元 Turbo。

腾讯表示,相比前代模型,腾讯混元 Turbo 性能有显著提升,训练效率提升 108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。

打开网易新闻 查看精彩图片

在腾讯全球数字生态大会上,腾讯公司副总裁、云与智慧产业事业群 COO 兼腾讯云总裁邱跃鹏宣布,腾讯混元Turbo在腾讯云上线,输入和输出价格只有前代模型的一半,企业和开发者可以直接在云上接入使用。(新浪科技)

快评:腾讯在大模型赛场上确实是后来者,却更早找到正确路线—腾讯混元在国内率先采用MoE结构,自研的万亿级层间异构MoE结构。只可惜,混元效果还停留在测评上,SuperCLUE国内第一,在元宝等产品上表现还打不过kimi、豆包等。

正如汤道生所言 ,对于腾讯来说,开始从模型技术本身,转到智能应用落地上。题外话,元宝、元器,腾讯是否要打造成龙、元彪、元华的七小福组合?

4、支付宝推出支小宝, 距离“AI 生活管家”还有多远?

9 月 5 日,支付宝发文,宣布推出 AI 生活管家支小宝。

官方介绍,支小宝是蚂蚁集团基于蚂蚁百灵大模型推出的支付宝 AI 生活管家,号称是国内首个服务型的 AI 原生应用,可通过对话快速订票、点餐、唤起公交码、查询附近吃喝玩乐等。

打开网易新闻 查看精彩图片

此前,支付宝就已经在app里试水AI智能助理,在支付宝内上划就会出现,此次更新不仅将支付宝内上划出现的智能助理改了名,还上线了一个独立的APP“支小宝”。

快评:很高兴看到AI终于可以走进人的生活了,支小宝的出现给AI管家开了个很好的头,作为支付宝的亲儿子,支小宝有能力让支付变得更快捷。

打开网易新闻 查看精彩图片

但目前来看,现在的功能还比较初级,一些功能甚至还不如支付宝原先的交易链路方便。举个例子,如果我想做公交,那我为啥不能用手机的NFC直接刷码上车,现在用支小宝,还要把APP打开,点开对话,再输入指令,等待大模型识别意图,再亮出码,这链路比原先的方式长了至少5s。

打开网易新闻 查看精彩图片

而且,支小宝作为一个AI助手,它比原先的支付宝强的应该是可以准确识别用户意图并给出答案,但鲸哥尝试了几次发现,如果是非预设的指令,支小宝经常难以识别用户意图,给出毫不相干或者毫无价值的信息。

只能说“国内首个服务型的 AI 原生应用”的口号先喊了再说,实际效果Just so so。

5、百度文心一言升级为文小言,大模型进步更值关注

百度文心一言 App 昨日获推 4.0.0 版本升级,更新日志显示,文心一言升级为「文小言」。

文小言 (原文心一言 App),是百度旗下新搜索智能助手,基于文心大模型,提供搜索、创作、聊天等 AI 能力。

本次升级后,文小言将提供问问题、陪聊天、写文章、画图片和下任务五大核心场景能力。同时,9 月内文心 4.0 大模型将对新用户免费开放。

快评:随着文心一言已经有2亿用户,名字易传播度一事就被提上日程。其实百度大模型比国内主流早了一年,如今无论测评还是用户体验都没什么领先了。其实相比其他大厂来说,百度核心问题,就是大模型和文心APP等并不在一个事业群。甚至如特工宇宙所言:“文心一言的 web 端,App 端,还有文心智能体平台,上面创建的智能体完全是不互通的”。

对于Robin来说,这一年重点关注是百度各种原有产品大模型化。百度文库、智能搜索等等,宣称接入AI后几倍增长。大模型进步的大旗,百度还能扛起来吗?

6、马斯克超级 AI 训练集群, Colossus 正式上线

打开网易新闻 查看精彩图片

马斯克近期在 X 平台发文,宣布 AI 超级计算机 Colossus 已经上线,从开始建设到上线仅耗时 122 天。Colossus 目前已使用 10 万张 H100 GPU ,马斯克在文中表示,他会在未来几个月内再增加 10 万张 GPU,其中包含 5 万张更先进的 H200 GPU。

快评:其实这周国外AI领域有很多大新闻,比如OpenAI以千亿美元估值融资。国外AI企业融资也是为了AI 训练集群,国外现阶段的显卡储备数量如下,未来还会翻倍。

打开网易新闻 查看精彩图片

在GPT4时代,国内大模型能够凭借现有显卡追上,5、6、7如何追赶呢?

AI鲸选社创建了行业高质量的『AIGC社群』,500位高质量行业人士已经入群,聚集上市公司CEO、所有互联网大厂、创业者以及投资者、媒体人等。我们组建了高端技术产品交流群AI热点交流群创投趋势交流群,欢迎AGI行业人士入群。添加vx:xhyshow,注明真实身份。

精准学首发语音端到端,1对1的 AI教育要变天?

一张价值50元的人脸,AI攻防战火热朝天