ModernBERT 模型公布；谷歌 DeepMind 优化 AI模型新思路；理想同学 App 官方详解上线|极新早报|ai模型|deepmind|ibm|人工智能|大模型|模型公布|知名企业|算法|谷歌deep

“一无所有的人是有福的，因为他们将获得一切！”

文｜小鱼

编辑 | 云舒

出品｜极新

要点速览

1、理想同学 App 官方详解上线：基于 Mind GPT 大模型打造，免费使用

2、ModernBERT 模型公布，接任“Hugging Face 下载榜第二”2018 年经典原版

3、芯片上市提速 30%：业界首个面向半导体行业的专用大语言模型 SemiKong 发布

4、谷歌 DeepMind 优化 AI 模型新思路，计算效率与推理能力兼得

5、小米汽车：小米SU7全年交付量超13万提前完成年度目标

6、最新！OpenAI官宣计划成立更传统营利性公司

▌IPO/投融资

1、工业边缘视觉系统服务提供商「深其深科技」完成股权转让，投资方为维太创科。

深其深科技是一家工业边缘视觉系统服务提供商，依托大学的技术研究资源，致力于新一代工业边缘视觉2.0体系架构、产品和解决方案的研发、产学研一体化的行业应用和商业规模化落地。公司致力于公共服务、生产制造业和智慧物流等定制专业视觉平台一站式机器视觉感知解决专家，打通工业互联智慧型工厂/场站最后一公里，为电网/轨交/冶金/化工/3C制造业/新能源制造业等提供运维、生产和物流视觉系统解决方案。

2、能源管理解决方案提供商「中科绿云」完成8000万人民币天使轮融资，投资方为新普高领投，瑞安资本、香港中金创投跟投。

中科绿云是一家能源管理解决方案提供商，专注于为各类企业提供全方位、智能化的能源管理解决方案。公司依托先进的技术亮点，如大数据分析、物联网技术、人工智能算法等，能够精准地对企业能源消耗进行实时监测、分析与优化，有效帮助企业降低能源成本，提升能源利用效率，进而实现可持续发展目标。中科绿云现已横向覆盖新型智慧能源，大数据，节能科技，供应链，私募基金，能源科技投资等热门行业及领域。

3、卫星组网解决方案提供商「鸿擎科技」完成3.4亿人民币A1轮融资，由海河产业基金、金砖基金领投。

赛恩领动是一家4D成像雷达解决方案提供商，通过在波形波束、天线设计等多方面的创新，真正从底层架构出发，设计出一款满足客户性能要求的4D成像雷达产品。同时公司以算法及软件实现感知能力的突破。基于对毫米波雷达数据特征的深度理解，将4D成像雷达点云应用于感知层面，如扩展目标跟踪，基于深度学习的多目标分类等，更好地与视觉为主的感知系统形成互补，创造产品的核心价值。

4、4D成像雷达解决方案提供商「赛恩领动」完成2亿人民币B轮融资，由海河产业基金、金砖基金领投。

▌科技要闻

1、理想同学 App 官方详解上线：基于 Mind GPT 大模型打造，免费使用

12 月 29 日消息，理想汽车今日公布理想同学 App 官方问答，对这款产品的功能、产品特色、车机与手机互联等方面进行了介绍。

据介绍，理想同学是一款免费的基于 Mind GPT 大模型打造的 AI 智能助手，理想同学 App 于 12 月 27 日已上线，苹果 iPhone 用户可通过应用商店搜索“理想同学”下载，安卓手机用户可以在理想汽车官网首页等下载。

理想同学 App 功能包括但不限于：

知识问答：提供汽车、出行、财经、科技等领域的专业解答。
视觉问答：识别并解释你可能不认识的动物、植物、汽车以及通用物品。
联网搜索：帮你在全网寻找信息，进行总结和提炼，并提供可信赖的参考资料。
文本处理：处理各种类型的文本，如写文章、文本翻译等。
提供建议：根据你的需求，为你的生活和工作提供建议，比如旅行规划和饮食建议等。

理想同学手机端和车端使用相同的账号体系，理想计划在未来增加更多手机与车辆的互联功能和记忆数据的互通能力。理想官方称，在服务过程中将严格遵循相关的隐私协议与规定，确保用户的信息得到保护，不会被泄露。（IT之家）

2、ModernBERT 模型公布，接任“Hugging Face 下载榜第二”2018 年经典原版

12 月 29 日消息，Hugging Face、英伟达和约翰霍普金斯大学研究人员联手为 Hugging Face 上的热门编码器模型 BERT 推出了全新版本 ModernBERT，号称在满足效率的同时新增支持处理长达 8192 个 Token 的上下文。

开发团队表示，尽管 BERT 模型自 2018 年发布以来仍被业界广泛使用，并且是 Hugging Face 上下载量第二大的模型（仅次于 RoBERTa），每月下载量超 6800 万次，但这款模型如今已有些落后。

在 BERT 模型首次发布 6 年后的今天，Hugging Face 和其他团队借鉴了近年来业界 LLM 的进展，对 BERT 模型架构和训练过程进行改进，最终公布了 ModernBERT 模型以接替原版 BERT 模型。

▲ ModernBERT 模型的基准测试结果

据悉，相关开发团队使用了 2 万亿个 Token 来训练 ModernBERT，使得该模型在多种分类测试和向量检索测试中都达到了目前业界领先水平，目前开发团队共计公布了两个版本的模型，分别是 1.39 亿参数和 3.95 亿参数版本（IT之家）

3、芯片上市提速 30%：业界首个面向半导体行业的专用大语言模型 SemiKong 发布

12 月 29 日消息，由 Aitomatic 公司及其“AI 联盟”合作伙伴共同开发的 SemiKong 已正式发布，这款大型语言模型（LLM）是全球首个专为满足半导体行业需求而打造的 AI 工具。SemiKong 旨在融入半导体设计公司的工作流程，充当该领域的“数字专家”，从而显著加快新芯片的上市速度。

图源：台积电

据 Aitomatic 公司介绍，半导体行业正面临着专业知识严重流失的困境。随着越来越多的资深专家退休，他们丰富的经验和知识也随之流失，导致许多公司面临严重的人才缺口。针对这一问题，专门为半导体行业需求训练的 LLM 被认为是帮助新工程师快速获取必要信息、保持竞争力的有效途径。

SemiKong 基于 Meta 的 Llama 3.1 LLM 平台构建，近期发布了其 700 亿参数的版本。Aitomatic 与包括 Meta、AMD 和 IBM 在内的新成立的 AI 联盟的其他合作伙伴共同开发了这款 LLM，并由 Aitomatic 的 DXA 系统作为 SemiKong 部署的基石。

DXA，即 Domain-Expert Agents（领域专家代理），是 Aitomatic 将较小的 LLM 代理与 SemiKong 70B 中央“蜂巢”连接的方式。通过对客户公司的技术库或专家工程师的经验进行训练，DXA 可以根据该公司的特定需求进行定制。经过训练的 DXA 随后由核心 SemiKong 部署使用，以自动化开发任务或提供与工程师和工人进行类似聊天机器人的通信。

凭借其目前的 700 亿参数版本以及基于 SemiKong 的较小 DXA 代理，该 LLM 在半导体领域的实用性已远远超过了通用 AI 模型。IT之家注意到，SemiKong 宣称可将新芯片设计的上市时间缩短 20-30%，并将首次投产成功率提高 20%。此外，其还声称可以将新工程师的学习曲线缩短高达 50%。

SemiKong 是新兴的 AI 联盟内部合作的首批成果之一，该联盟于 2023 年 12 月宣布成立。作为众多旨在对抗英伟达在科技行业的主导地位的企业联盟之一，AI 联盟成员包括 IBM 和 AMD 等大型企业，以及耶鲁大学和东京大学等研究机构。（IT之家）

4、谷歌 DeepMind 优化 AI 模型新思路，计算效率与推理能力兼得

12 月 28 日消息，谷歌 DeepMind 团队最新推出了“可微缓存增强”（Differentiable Cache Augmentation）的新方法，在不明显额外增加计算负担的情况下，可以显著提升大语言模型的推理性能。

项目背景

注：在语言处理、数学和推理领域，大型语言模型（LLMs）是解决复杂问题不可或缺的一部分。

计算技术的增强侧重于使 LLMs 能够更有效地处理数据，生成更准确且与上下文相关的响应，随着这些模型变得复杂，研究人员努力开发在固定计算预算内运行而不牺牲性能的方法。

优化 LLMs 的一大挑战是它们无法有效地跨多个任务进行推理或执行超出预训练架构的计算。

当前提高模型性能的方法涉及在任务处理期间生成中间步骤，但代价是增加延迟和计算效率低下。这种限制阻碍了他们执行复杂推理任务的能力，特别是那些需要更长的依赖关系或更高地预测准确性的任务。

项目介绍

“可微缓存增强”（Differentiable Cache Augmentation）采用一个经过训练的协处理器，通过潜在嵌入来增强 LLM 的键值（kv）缓存，丰富模型的内部记忆，关键在于保持基础 LLM 冻结，同时训练异步运行的协处理器。

整个流程分为 3 个阶段，冻结的 LLM 从输入序列生成 kv 缓存；协处理器使用可训练软令牌处理 kv 缓存，生成潜在嵌入；增强的 kv 缓存反馈到 LLM，生成更丰富的输出。

在 Gemma-2 2B 模型上进行测试，该方法在多个基准测试中取得了显著成果。例如，在 GSM8K 数据集上，准确率提高了 10.05%；在 MMLU 上，性能提升了 4.70%。此外，该方法还降低了模型在多个标记位置的困惑度。

谷歌 DeepMind 的这项研究为增强 LLMs 的推理能力提供了新的思路。通过引入外部协处理器增强 kv 缓存，研究人员在保持计算效率的同时显著提高了模型性能，为 LLMs 处理更复杂的任务铺平了道路。（IT之家）

▌股市风云

1、小米汽车：小米SU7全年交付量超13万提前完成年度目标

12月28日，小米汽车宣布，截至目前，小米SU7全年交付量已超过13万台，已提前完成全年所有目标。（界面新闻）

2、最新！OpenAI官宣计划成立更传统营利性公司

当地时间12月27日，OpenAi官网发布博客文章，宣布OpenAI的董事会在评估改变自身结构，以便最好地支持确保AGI造福全人类这一使命。改变是为了达成三个目标：

一、选择最适合AGI使命长期内取得成功的非营利性/营利性结构；

二、让非营利组织可持续发展；

三、让旗下的营利和非营利组织都发挥各自的作用。

为了达成以上第一个目标，OpenAI计划，将旗下现有的营利性组织转变为名为公共利益公司（PBC）的实体，成立一家遵循美国特拉华州法律注册的PBC。

换言之，OpenAI打算选择PBC这种兼具营利性和社会效益双重属性的实体形式。相比现有结构，是一种更向传统公司考虑的形式，因为PBC是传统公司和非营利组织之间的混合形式。一些OpenAI的人工智能（AI）领域对手现在就是一PBC形式运营，比如Anthropic和马斯克创立的xAI。

OpenAI称，PBC既有普通股，也将OpenAI的AGI使命作为自身的公益利益。这种结构要求公司在决策过程中平衡股东、利益相关方和公益三方面的利益。它能让OpenAI像AI领域的其他公司一样，以常规方式筹集必要的资金。

为了达成第二个目标，OpenAI计划让现有的非营利组织持有PBC的股份，通过这种形式获得现有营利组织的大量权益，PBC将由独立的财务顾问确定一个公平的估值。这种做法会让OpenAI捐助者提供的资源成倍增加。OpenAI称，由此将诞生“史上资源最丰富的非营利组织之一。”

OpenAI的博客文章透露，目前各大公司在人工智能开发上投入数千亿美元，这体现了OpenAI将需要付出多大的努力才能继续完成使命。我们需要再次筹集超出我们想象的更多资金。投资者希望支持我们，但以这种规模的资本，我们需要的传统股权和更少的结构定制。

OpenAI现有的营利部门目前由其非营利组织控制。OpenAI成立于2015年，最初是一家非营利组织，但为了获得投资，该公司在2019年成立了一家名为营利性子公司。

OpenAI称，目前的结构不允许董事会直接考虑投资人的利益，也不允许非营利组织轻易做控制营利组织以外的工作。未来PBC将经营和控制OpenAI 的运营和业务，非营利组织则将聘请领导团队和员工在医疗保健、教育和科学等领域开展慈善活动。也就是说，PBC将负责OpenAI的商业运营，非营利组织雇人手开展慈善活动，如此达成第三个目标。

OpenAI于2022年11月推出了聊天机器人ChatGPT，ChatGPT的横空出世引发了AI热潮，不仅微软、谷歌、Meta和苹果等科技巨头纷纷入局，更有Anthropic和埃隆·马斯克的xAI等AI初创企业挑战其领先地位。

开发先进AI模型的成本非常高，面对一众劲敌，OpenAI需要更多资金，但该公司复杂的结构让其吸引投资时受到限制。

“我们再次需要比预期更多的资金。投资者愿意支持我们，但这种规模的资本需要传统股权形式和更少的结构性限制，”OpenAI周五在声明中表示。

OpenAI今年秋季完成了新一轮融资，筹集了66亿美元资金的同时，公司估值达到了1570亿美元之多，较年初几乎翻了一番。今年年初，OpenAI员工出售现有股份时，该公司的估值为860亿美元。

OpenAI表示：“（新的结构）将使我们能够像该领域的其他公司一样，以传统的方式筹集必要的资金。”

需要说明的是，Anthropic和xAI就采取类似的结构。

早在8月底传出OpenAI进行新一轮融资的消息时，就有多家媒体爆料称，该公司考虑改变自身架构，从而使其对投资者更具吸引力。（每日经济新闻）

▌好文推荐

“盘点2024，大模型产业落地有五个潮流。”

更多干货分享敬请关注我们的公众号与视频号~超多精彩对话内容等待您的解锁！

扫码加入【极新】科技行业交流群，探索科技前沿趋势，本群适合创始人、CXO、行业高管。

关于极新：

极新是垂直于产业AI的创投和行业研究媒体，致力于陪伴和记录科技企业进步和产业成长。已与多家平台和创新企业深度对话和合作，包括华为云、阿里云、百度智能云、金山云、飞书、火山引擎、钉钉、东软、Zoho、容联云、百家云等平台企业，以及智谱AI、百川智能、格灵深瞳、深势科技、百图生科、瑞莱智慧、创客贴、生数科技等高成长公司。

2024投融资趋势追踪：| | | | | ||｜|

深度对话·创新&增长的源动力：| | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | ｜