1月27日,DeepSeek团队发布全新DeepSeek-OCR 2模型并开源,采用创新的DeepEncoder V2方法,让AI能够根据图像的含义动态重排图像的各个部分,而不再只是机械地从左到右扫描。这种方式更接近人类的视觉编码逻辑。最终,该模型在处理布局复杂的图片时,表现优于传统的视觉-语言模型,实现了更智能、更具因果推理能力的视觉理解。

打开网易新闻 查看精彩图片

编辑|程鹏 杜波

校对|许绍航

封面图片来源:视觉中国(资料图)

每日经济新闻综合自每经AI快讯