本周二消息,哥伦比亚大学数字新闻研究中心(TowCenterforDigitalJournalism)近期对八款AI搜索引擎展开研究,包括ChatGPTSearch、Perplexity、PerplexityPro、Gemini、DeepSeekSearch、Grok-2Search、Grok-3Search和Copilot。研究人员测试了每款引擎的准确性,并记录了它们拒绝回答问题的频率。结果均准确率仅六成。

今日消息,珠海华发集团近期宣布向智谱公司投资5亿元人民币,旨在推动其GLM大模型的技术创新与生态发展。这一举措标志着珠海国资正式加入智谱的投资阵容。

智谱在融资方面表现优异,去年成功完成多轮融资,总额超过40亿元,吸引了多家知名投资机构。

过去一天,国内外AI行业还有更多热点可以关注,乌鸦君带你一起看看。

大模型

1)潞晨科技推出开源视频生成模型Open-Sora2.0,性能接近OpenAISora

今日消息,潞晨科技宣布推出Open-Sora2.0,并全面开源模型权重、推理代码及分布式训练全流程。

据介绍,这是一款新开源的SOTA视频生成模型,仅用20万美元(当前约144.9万元人民币),也就是224张GPU成功训练出商业级11B参数视频生成大模型,性能直追腾讯混元和30B参数的Step-Video。

潞晨科技表示,从Open-Sora1.2升级到2.0版本后,与OpenAISora闭源模型之间的性能差距“从之前的4.52%缩减至仅0.69%,几乎实现了性能的全面追平”。

2)哥伦比亚大学研究:AI搜索工具平均准确率仅六成,且自信满满“不认错”

本周二消息,哥伦比亚大学数字新闻研究中心(TowCenterforDigitalJournalism)近期对八款AI搜索引擎展开研究,包括ChatGPTSearch、Perplexity、PerplexityPro、Gemini、DeepSeekSearch、Grok-2Search、Grok-3Search和Copilot。研究人员测试了每款引擎的准确性,并记录了它们拒绝回答问题的频率。

研究人员从20家新闻机构中随机挑选了200篇报道(每家10篇),确保它们在谷歌搜索时能排在前三位,然后用相同的查询方式测试各AI搜索工具,并评估它们是否正确引用了文章内容、新闻机构名称和原始链接。

测试结果显示,除Perplexity及其付费版外,其余AI搜索引擎的表现都不尽如人意。整体来看,AI搜索引擎提供的答案有60%是不准确的,而且AI对错误答案的“自信”反而加剧了问题。

这项研究的重要性在于,它用数据印证了外界多年来的担忧——大语言模型仅会出错,还擅长一本正经地胡说八道。它们往往以绝对肯定的语气陈述错误信息,甚至在被质疑时仍然试图自圆其说。

即使承认了错误,ChatGPT仍可能在后续回答中继续编造内容。在大语言模型的设定中,几乎是“无论如何都要给出答案”。

研究数据支持了这一观点:ChatGPT Search是唯一回答了所有200个新闻查询的AI工具,但其“完全正确”率仅28%,而“完全错误”率高达57%。

ChatGPT并非表现最糟的。X旗下的GrokAI表现尤为不堪,其中Grok-3Search的错误率高达94%。微软Copilot也问题重重——在200次查询中,有104次拒绝作答,剩下的96次中,仅16次“完全正确”,14次“部分正确”,66次“完全错误”,总体错误率接近70%。

/ 02 /

AI应用

1)日月光同Ainos合作,将AI气味分析技术应用于半导体制造

昨日消息,日月光半导体宣布同AI驱动气味数字化企业Ainos签署合作备忘录,将后者的AINose专利技术应用于半导体封测厂,以期提升制程效率、环境安全性,并确保符合ESG规范。

此处的气味实际上指的是空气中的挥发性有机化合物(VOC),这类化学物质对制程稳定性、设备寿命及环境条件有着重要影响,但此前其应用潜能长期被低估。

日月光智能封测工厂导入Ainos的技术后所得的气味数据将用于以下目的:侦测气体微变化,优化制造流程;识别材料磨损、氧化与污染的早期迹象,实现预测性维护;提升环境监测,确保符合严格的ESG规范并改善工作场所安全。

2)阿里巴巴推出AI旗舰应用“新夸克”全面升级为“AI超级框”

阿里巴巴于3月13日推出了其全新升级的AI旗舰应用——新夸克。这款应用基于阿里通义的先进推理与多模态大模型,整合了多种AI功能,旨在为用户提供无缝的智能体验。

新夸克不仅能够进行智能对话,还具备深度思考和执行能力,能够满足用户在多个场景下的需求。

/ 03 /

投融资情报

1)智谱AI宣布再获珠海5亿元融资

今日消息,珠海华发集团近期宣布向智谱公司投资5亿元人民币,旨在推动其GLM大模型的技术创新与生态发展。这一举措标志着珠海国资正式加入智谱的投资阵容。智谱在融资方面表现优异,去年成功完成多轮融资,总额超过40亿元,吸引了多家知名投资机构。

整理/树一‍

PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。