乌鸦AI日报：OpenAI、xAI“全军覆没”，AI搜索工具平均准确率仅六成；智谱AI宣布再获珠海5亿元融资|openai|乌鸦ai日报|搜索引擎|智谱|珠海市|融资|错误率

本周二消息，哥伦比亚大学数字新闻研究中心（TowCenterforDigitalJournalism）近期对八款AI搜索引擎展开研究，包括ChatGPTSearch、Perplexity、PerplexityPro、Gemini、DeepSeekSearch、Grok-2Search、Grok-3Search和Copilot。研究人员测试了每款引擎的准确性，并记录了它们拒绝回答问题的频率。结果均准确率仅六成。

今日消息，珠海华发集团近期宣布向智谱公司投资5亿元人民币，旨在推动其GLM大模型的技术创新与生态发展。这一举措标志着珠海国资正式加入智谱的投资阵容。

智谱在融资方面表现优异，去年成功完成多轮融资，总额超过40亿元，吸引了多家知名投资机构。

过去一天，国内外AI行业还有更多热点可以关注，乌鸦君带你一起看看。

大模型

1）潞晨科技推出开源视频生成模型Open-Sora2.0，性能接近OpenAISora

今日消息，潞晨科技宣布推出Open-Sora2.0，并全面开源模型权重、推理代码及分布式训练全流程。

据介绍，这是一款新开源的SOTA视频生成模型，仅用20万美元（当前约144.9万元人民币），也就是224张GPU成功训练出商业级11B参数视频生成大模型，性能直追腾讯混元和30B参数的Step-Video。

潞晨科技表示，从Open-Sora1.2升级到2.0版本后，与OpenAISora闭源模型之间的性能差距“从之前的4.52%缩减至仅0.69%，几乎实现了性能的全面追平”。

2）哥伦比亚大学研究：AI搜索工具平均准确率仅六成，且自信满满“不认错”

研究人员从20家新闻机构中随机挑选了200篇报道（每家10篇），确保它们在谷歌搜索时能排在前三位，然后用相同的查询方式测试各AI搜索工具，并评估它们是否正确引用了文章内容、新闻机构名称和原始链接。

测试结果显示，除Perplexity及其付费版外，其余AI搜索引擎的表现都不尽如人意。整体来看，AI搜索引擎提供的答案有60%是不准确的，而且AI对错误答案的“自信”反而加剧了问题。

这项研究的重要性在于，它用数据印证了外界多年来的担忧——大语言模型仅会出错，还擅长一本正经地胡说八道。它们往往以绝对肯定的语气陈述错误信息，甚至在被质疑时仍然试图自圆其说。