能同时处理文本、图片等信息的多模态 AI,正从技术名词变为民生日常,今日头条热榜记录下它的双面足迹。​

打开网易新闻 查看精彩图片

武汉 “灵智” 医疗智能体成近期热点,这款融合语音、视觉的设备能 “听懂” 主诉、“看见” 状态,2 分钟完成分诊与病历生成,让急诊接诊效率翻倍,在三甲医院 2 万例问诊中准确率达 93%。而 DeepSeek 的 “视觉文本压缩” 技术却引发争议,中日联合研究发现其靠语言直觉 “猜内容”,而非真 “看懂” 图片,给医疗、金融等高危场景敲醒警钟。​

从救急救忙到技术纠偏,热榜里的多模态 AI 既彰显着 “图文互通” 的实用价值,也在争议中探索更可靠的落地路径。