当地时间5月1日,美国商务部直属机构——美国国家标准与技术研究院(NIST)下属的人工智能标准与创新中心(CAISI)发布对我国DeepSeek V4大模型的评估结果。评估认为,DeepSeek V4比美国技术更具成本优势,但能力相差8个月。

打开网易新闻 查看精彩图片

CAISI测试了DeepSeek V4在网络安全、软件工程、自然科学、抽象推理和数学等领域的能力,结果包括:DeepSeek V4是迄今为止CAISI评估过的最强大的中国人工智能(AI)模型。DeepSeek V4的实际性能与美国8个月前发布的GPT-5类似。与美国性价比最高的GPT-5.4 mini相比,DeepSeek V4在7项基准测试中的5项上成本更低。

此外,CAISI还发布了一张中美最强模型总体能力随时间的推移图,暗示中美AI技术差距日益扩大。不过,有多家专业科技媒体对CAISI的评估结果表示质疑。AI领域新闻网站The Decoder发文称,CAISI的评估很可能带有自身的政治目的。人工智能、比特币新闻网站Decrypt则援引了人工智能分析(Artificial Analysis)公司的评估结果。该公司评估认为,DeepSeek和OpenAI顶尖模型的差距实际上正在缩小。

来源:科技日报 B57