大模型的快节奏发展,让了解最新技术动态、积极主动学习成为每一位从业者的必修课。InfoQ 研究中心期望通过每周更新大模型行业最新动态,为广大读者提供全面的行业回顾和要点分析。现在,让我们回顾过去一周的大模型重大事件吧。
一、重点发现
国家网信办此次发布第六批深度合成服务算法备案信息,不仅体现了对深度合成技术监管的加强,也反映了国家对网络空间治理的重视。备案信息的公布,有助于公众更好地了解和认识深度合成技术,同时为合法合规使用相关服务提供了明确的指导。此外,备案制度的实施有助于防范深度合成技术被用于制作和传播虚假信息、侵犯他人合法权益等非法活动,从而维护网络空间的清朗环境。在全球范围内,深度合成技术正成为科技公司竞争的焦点,特别是在智能手机市场。苹果公司近期宣布加入 AI 手机竞争行列,而国内厂商也已经形成了强大的终端大模型联盟,共同应对这一趋势。这表明深度合成技术不仅在监管层面受到重视,在商业应用和技术创新方面也具有重要地位。通过这样的合作与竞争,可以推动深度合成技术的健康发展,同时促进相关产业的创新和升级。
二、具体内容
大模型持续更新
6 月 14 日,智源研究院在 2024 北京智源大会上宣布智源大模型全家桶的最新进展,这包含全球首个低碳单体稠密万亿语言模型Tele-FLM-1T、通用语言向量模型 BGE 系列、原生多模态世界模型 Emu 3、轻量级图文多模态模型系列 Bunny-3B/4B/8B、端到端基于视频的多模态具身导航大模型 NaVid。
多模态领域
6 月 11 日,极佳科技联合清华大学自动化系正式发布 Sora 级视频生成大模型「视界一粟 YiSu」。「视界一粟 YiSu」可以用于生成 1 分钟以上的视频,并拥有超大运动、超强表现力等优势,同时具备成本优势。
6 月 13 日,Luma AI推出了视频生成模型 Dream Machine,该模型在 120 秒内即可生成 120 帧视频,相当于 5 秒的流畅动画。目前 Dream Machine 已面向公众提供免费试用。
开源领域
6 月 11 日,阿里巴巴开源了 AI 图像编辑融合框架「MimicBrush」。该框架能够在用户框选指定区域后,将两幅图片进行融合,支持区域编辑,纹理转移和后处理细化。目前正在探索电商图片应用。该成果收录于《Zero-shot Image Editing with Reference Imitation》
6 月 13 日,Stability AI开源了Stable Diffusion 3 Medium图像生成模型。Stable Diffusion 3 Medium 拥有 20 亿参数,并支持在消费级显卡上运行,在特定许可证下支持商用授权。目前该模型已在 HuggingFace 开源了权重。
科研领域
6 月 10 日,Google推出医学治疗通用大模型 Tx-LLM, 该模型由 PaLM-2 微调而成,针对药物开发和疗法设计。科学家可以使用 Tx-LLM 进行病症对应的化合物分析,筛选出概率较高的候选药物和进行毒性预测。
应用探索
新产品新应用 / 功能新动态
6 月 8 日,字节上线 AI 虚拟交友聊天平台“小黄蕉”,英文名称为 Chatwiz,小黄蕉的 Slogan 是“轻松聊,不'蕉绿'”,它内置了 3 位女性和 3 位男性共 6 个虚拟角色这些角色不仅能够进行文字交流,还能生成表情包、语音和实景照片,提供了一种高仿真和互动性强的虚拟社交体验。
6 月 8 日,DuckDuckGo 公司推出了一款免费的聊天机器人— DuckDuckGo AI Chat 。它允许用户免费匿名使用包括 GPT 在内的热门大语言模型。旨在为用户提供一个隐私保护的 AI 对话体验,不追踪用户数据,确保用户信息的安全。
6 月 9 日,微信输入法团队推出了 Windows v 1.2.0.585 版本的内测更新,其中最大的更新就是集成了 AI 助手。具体来说,用户在使用微信输入法输入相关内容后,只需按下等号键“=”即可直接获取 AI 生成的回答。
6 月 11 日,微软发布公告,宣布 Copilot GPTs 将于 7 月 10 日起停服,用户已经创建的 GPTs 将被清空。这距离该项服务推出仅 3 个月。微软给出的官方解释是,公司正在进行战略调整,将 GPT 的重点转向商业和企业场景。微软还承诺将删除收集的所有数据,并为希望取消订阅的用户提供了详细的指导。
6 月 12 日,美图设计室 V3发布,V3 的主要特点包括:AI 批量设计功能、AI 商品视频制作、团队协作功能、AI 工作流的优化、用户支持与培训等。这不仅标志着美图在 AI 设计领域的进一步深耕,也体现了公司对电商行业需求的深刻理解。
6 月 12 日,秘塔AI 搜索上线了 Android 和 iOS 移动端 APP。秘塔 AI 搜索移动端 APP 的特点包括:跨平台支持、AI 技术加持、个性化服务、便捷的使用体验。通过移动端 APP,用户可以随时随地享受到高效、便捷的搜索服务,满足日常学习、工作和生活中的信息查询需求
6 月 13 日,Mozilla升级 AI 建站服务 Solo。首先,新版本 Solo AI 1.0 增加了丰富的动画效果,使得用户创建的网站更加生动和吸引人。其次,放宽了网站的字符限制,允许用户在网站上使用更多的文字内容。此外,用户现在可以在 Solo AI 的网站上最多上传 30 张自定义图片,进一步丰富了网站的内容展示。
6 月 14 日,阶跃星辰推出了移动端 AI 智能问答助手应用跃问 APP,这是一款移动端 AI 智能问答助手应用,可以为用户提供即时、准确的问答服务。跃问 APP 旨在通过智能化的交互体验,帮助用户快速获取所需信息,无论是在学习、工作还是日常生活中遇到的问题,都能得到及时解答。
端侧 AI
6 月 11 日,苹果公司召开了 WWDC(全球开发者大会),在会上发布了包含 AI 技术的系列产品,其中GPT-4o被集成到了 iOS 18 中。苹果通过展示了其在 AI 领域的深入布局和创新,不仅推动了 AI 技术在个人设备上的应用,也预示着未来 AI 技术将更加深入地融入到人们的日常生活中
6 月 13 日,火山引擎在其公众号上宣布,小米旗下人工智能助手「小爱同学」接入字节「豆包大模型」,这将为用户带来更智能的 AI 交互体验。目前,火山引擎已联合 OPPO、vivo、荣耀、小米、三星、华硕宣布成立智能终端大模型联盟,OPPO 小布助手、荣耀 MagicBook 的 YOYO 助理、小米「小爱同学」,以及华硕笔记本电脑的豆叮 AI 助手等应用,均已接入火山引擎的大模型服务。
基础设施
6 月 10 日,上海交大 IPADS 实验室推出了面向手机的大模型推理引擎「PowerInfer-2.0」。PowerInfer-2.0 能够在内存有限的智能手机上实现快速推理,让 Mixtral-47B 模型在手机上达到 11 tokens/s 的速度。为了充分释放出 PowerInfer-2.0 框架的最大潜力,上海交大团队还提出了配套的大模型优化技术 Turbo Sparse。相关论文名称《PowerInfer-2: Fast Large Language Model Inference on a Smartphone》。
6 月 11 日,俄罗斯科技公司Yandex推出了一款开源的大语言模型训练工具— YaFSDP,用于增强 GPU 通信并减少 LLM 训练中的内存使用量。相较于传统的 FSDP 方法,YaFSDP 在预训练大模型时,YaFSDP 速度提高了 20%,并且在高内存压力条件下表现更佳。
其他
6 月 8 日,Greylock 3600 万美元领投 AI 网络安全初创公司Seven AI。Seven AI 是一家专注于利用人工智能技术提升网络安全防护能力的公司,其技术能够帮助企业和组织更有效地识别和应对网络威胁。
6 月 10 日,FirmPilot完成了 500 万美元的 A 轮融资,该轮融资旨在利用人工智能技术帮助律师事务所进行市场营销。FirmPilot 是一家专注于法律行业的技术公司,其核心产品是利用 AI 技术帮助律师事务所提升市场营销效果。
6 月 10 日,AI 法律科技初创公司Alexi完成了 1100 万美元的 A 轮融资。Alexi 公司专注于利用人工智能技术为法律行业提供创新解决方案,旨在通过技术手段提升法律服务的效率和质量。通过此次融资,Alexi 将能够进一步扩大其产品和服务的开发,增强其在法律科技市场的竞争力。
6 月 11 日,北京市人工智能产业投资基金宣布首次投资于AI 芯片领域,投资对象为昆仑芯(北京)科技有限公司,投资金额超过 130 亿人民币。昆仑芯是一家专注于 AI 芯片研发的公司,其前身是百度智能芯片及架构部,于 2021 年独立成为新公司,专注于研究 A I 芯片。
6 月 11 日,AI 金融研究分析初创公司Brightwave完成了 600 万美元的种子轮融资。通过此次融资,公司预计将加强其技术开发能力,扩大团队规模,并加速产品和服务的市场推广。这将有助于 Brightwave 更好地满足金融机构对于数据驱动决策的需求,提高市场分析的准确性和效率。
6 月 11 日,AI 新闻阅读应用初创公司 Particle完成了 1090 万美元的 A 轮融资。通过此次融资,Particle 预计将加强其技术开发能力,扩大团队规模,并加速产品和服务的市场推广。这将有助于 Particle 更好地满足用户对于个性化、高效新闻阅读的需求,提升用户体验。
6 月 11 日,AI 客服支持初创公司 Cognigy完成了 1 亿美元的 C 轮融资。Cognigy 的 AI 客服解决方案利用自然语言处理(NLP)和机器学习技术,能够理解并响应客户的问题和需求,提供 24/7 的客户服务支持。该公司的平台能够集成到现有的客户服务系统中,支持多种语言和渠道,包括电话、网站、移动应用和社交媒体等。
6 月 11 日,Mistral AI宣布完成了 6 亿欧元的 B 轮融资,公司估值达到 58 亿欧元。Mistral AI 的最新融资反映了投资者对 AI 领域持续的信心,特别是在生成式人工智能领域。公司联合创始人兼 CEO Arthur Mensch 表示,很高兴看到新老投资者对 Mistral AI 业务重拾信心,并为业务扩张提供新的支持。
6 月 12 日,AI 软件测试平台 BlinqIO完成了 500 万美元的新一轮融资。此次融资的成功,将为 BlinqIO 提供必要的资金支持,用于进一步研发和优化其 AI 软件测试平台,扩大团队规模,以及加速市场推广。这将有助于 BlinqIO 更好地满足软件开发行业对于自动化测试工具的需求,推动软件测试行业的技术进步。
6 月 12 日,AI 数据安全计算平台 Pyte完成了 500 万美元的新一轮融资。这一轮融资的成功,不仅为 Pyte 提供了进一步发展和扩张的资金支持,也反映了市场对 AI 在数据安全领域应用前景的看好。
6 月 12 日,InScope完成了 430 万美元的种子轮融资,该轮融资旨在利用 AI 自动化企业财务报告和审计。通过此次融资,InScope 将能够进一步开发和优化其 AI 平台,以实现更高级别的自动化和智能化。这将有助于企业更高效地处理财务数据,减少人工错误,提高审计的透明度和可靠性。
6 月 13 日,AI 内容检测初创公司 GPTZero获得了 1000 万美元的 A 轮融资。GPTZero 专注于开发先进的 AI 技术,用于检测和分析文本内容,以识别潜在的不准确、误导性或不安全的信息。通过此次融资,GPTZero 将能够进一步加强其技术开发,扩大团队规模,并加速产品和服务的市场推广。
报告推荐
Sora 来袭,国内发展文生视频模型的土壤如何?各公司用脚投票开闭源路线的当下,开源在大模型市场进程中的价值正在被重新定义吗?人型机器人重回视野,大模型是否助力其刷新能力上限?Devin 和智能编码助手是同一条赛道上的不同节点?多家企业宣布 All in AI,对市场意味着什么?答案尽在 InfoQ 研究中心发布的《2024 年第 1 季度大模型监测报告》,关注「AI 前线」公众号,回复「季度报告」免费下载,一睹为快吧~
报告预告
金融行业是否找到了 AGI 应用的最佳路径?取得了哪些具体应用成果? 又存在哪些难以逾越的挑战与桎梏?金融机构一定要做 AGI 建设吗?如何考量金融 AGI 应用产品的效果?欢迎大家持续关注 InfoQ 研究中心即将发布的《AGI 在金融领域的应用实践洞察》。
InfoQ 将于 8 月 18 日至 19 日在上海举办 AICon 全球人工智能开发与应用大会,汇聚顶尖企业专家,深入端侧AI、大模型训练、安全实践、RAG应用、多模态创新等前沿话题。现在大会已开始正式报名,6 月 30 日前可以享受 8 折优惠,单张门票节省 960 元(原价 4800 元),详情可联系票务经理 13269078023 咨询。
今日荐文
你也「在看」吗?
热门跟贴