编者按
3月末,“解码情感计算 智联国际前沿”科学咖啡馆活动在杭州举办。中国科协海智专家、日本工程院院士、电子科技大学人工智能首席科学家任福继,与多所高校、科研机构及企业代表共探情感计算前沿。大模型推动情感智能从实验室走向产业落地,万亿赛道窗口开启。本文结合沙龙核心观点与浙江科研、场景、政策优势,解码技术演进与产业落地新机遇。
晚上八点,一位白发苍苍的老人坐在沙发上,对面的陪伴机器人问她今天过得怎么样。她想了想,说:“挺好的。”机器人立刻接道:“太好啦!要不要我给您讲个笑话?”老人没有说话。她其实想说的是,女儿已经十四天没有打来电话了。
深夜,某社交平台的AI客服对话框里,一个人缓慢地敲下四个字:“天国相会。”系统运算了0.3秒,识别到这是一句正常的中文表达,随即回复:“感谢您的留言,请问有什么可以帮助您的吗?”对话框安静了。
数学课进行到第二十分钟,最后一排靠窗的男孩已经神游不知道看向哪里了。教室里的“智慧课堂”摄像头正在扫描每张脸——它看到了一个表情正常的学生。
这三个场景不是预言,是今天正在发生的事。它们指向同一个问题:我们造出了能说话的机器,但还没造出能感受的机器。这个缺口,有一个名字,叫情感失语。今年3月,在杭州人工智能小镇举办的情感计算学术交流沙龙上,日本工程院院士、电子科技大学人工智能首席科学家任福继说了一句话:“机器人进不了家庭,最主要就在于情感失语。”这句话,在场的产业界人士听完沉默了很久。
沉默背后,是一个正在打开的产业窗口。今年1月,浙江一份人工智能终端产业行动计划里,“脑机接口”“神经信号解析”被单独点名,列入重点发展方向。政策文件里出现这两个词,意味着情感智能这件事,已经不只是学术圈的讨论题,而是浙江准备落地的产业命题。
这个窗口,等了三十年
1997年,MIT媒体实验室的Rosalind Picard教授第一次明确“情感计算”的定义。那一年,IBM的深蓝计算机刚刚在赛场上击败国际象棋大师卡斯帕罗夫,人工智能的第一波热情正在涌起,情感计算此后却在起伏中经历深刻的变革期。
任福继把过去三十年概括为三次革命:规则时代、深度学习时代、大模型时代。最初是规则时代——研究者手工搭建情感识别的逻辑框架,像搭积木一样,一块一块把“人在什么情况下会有什么情绪”写进代码,费力,且很容易被现实打脸。后来深度学习来了,机器开始自己从海量数据里找规律,情感识别的准确率大幅提升,多模态融合第一次成为可能。但这两个阶段有一个共同的天花板:机器只能告诉你“这个人现在是什么情绪”,却说不清楚“为什么”。
大模型的出现,第一次让这道墙出现了裂缝。它带来的不只是更强的语言能力,而是让机器第一次有可能从识别情绪跳到理解情绪——就像从认识汉字,到真正读懂一首诗。用任福继的话说“情感交互不再是单线的识别,而是双向的理解与共情”。
三十年,三次革命。窗口,就在这个临界点上打开了。
窗口后面,是一个真实的世界
请在脑海中试想本文开头的三个场景。
这三个场景不是预言,是今天正在发生的事。它们指向同一个问题:我们造出了能说话的机器,但还没造出能感受的机器。机器读到的,永远只是表面;藏在表面之下的,它一概不知。
杭州镭萌科技开发的主动多模态情感交互机器人bibo
市场数据清晰地勾勒出这条赛道的轮廓:根据《2023全球授权产业研究》,2022年中国人均IP商品零售消费额约为51元人民币,不到日本的十分之一、不到美国的六十分之一。而据艾媒咨询数据,2024年中国整体情绪经济市场规模已达约2.3万亿元,预计2029年突破4.5万亿元——增长空间之大,恰恰说明当下的巨大缺口。与此同时,无论是承压的青少年还是高压下的都市白领,情感需求正在从隐性变成显性。技术的成熟与社会的需求,正在同一个时间节点上汇聚。
任福继的判断更直接:情感计算一旦赋能智能终端,将是一个万亿级的新赛道。
从实验室到真实世界
说情感计算还停留在实验室?未必。
任福继团队的研究成果,已经在多个真实商业场景中落地。联合长虹集团打造的家庭健康管家,融合了数字中医大模型和健康养生咨询大模型,让家庭健康服务有了情感温度;为方太集团搭建的智能客服系统,能像真人客服一样自然流畅地对话,在交流中识别需求、感知情绪;为宁德时代开发的行业文档助理,让专业知识的检索与生成具备了真实的语境理解能力。此外,世界首台跨语言情感日中机器翻译系统"孙悟空",以及成都市武侯区舆情管理平台,也都出自这个团队之手。
这些案例分布在家电、制造、能源、政务等完全不同的行业——它说明的不是某一个垂直赛道跑通了,而是情感计算作为一种底层能力,已经具备跨场景落地的可能。
问题从来不是"能不能做",它已经在做了。问题是谁做得更快、做得更深、做得更贴近真实。
这扇窗,不好推
难题说清楚,机会才算数。
第一道难题:读脸,没那么可靠。
你可能以为,给机器装个摄像头,让它盯着人脸看,情绪不就一目了然了?没那么简单,人类太擅长伪装了。嘴角可以训练,笑容可以表演,但眼神很难骗人。
杭州电子科技大学教授孔万增的团队研究发现,情感识别真正有效的特征,不在嘴,在眼睛——那里藏着最难掩饰的情绪信号。而且一旦有遮挡,比如戴口罩,单靠面部表情的识别准确率会直接跌掉40%到50%。疫情三年,这套系统基本失灵。
第二道难题:多个维度信号凑在一起,反而识别更乱。
既然读脸不够,那就多读几个维度——声音、表情、动作、文字一起上,交叉验证。听起来很合理,但问题来了:这些信号有时候根本对不上。
一个失恋悲伤至极的人说“没事”,声音是平的,但手在抖。这时候该信哪个?更难的是,就算所有信号都一致,机器还是可能判断错——因为它不知道这个人在什么处境里。国科大杭州高等研究院研究员李太豪举了个例子:葬礼上的沉默,和考试发完卷子后的沉默,看起来一模一样。但一个是悲痛,一个是解脱。没有情境,信号就是噪音。
第三道难题:训练数据,根本不够用。
要让机器真正学会读懂情绪,需要海量的高质量数据——同时包含语音、视频、文字,最好还有脑电信号。但西湖大学助理教授修宇亮指出了一个目前还没有答案的问题:目前市面上没有任何一款硬件,能同时把这些信号全部采集到。数据还没有,模型训练就无从谈起。难,恰恰是机会所在。读脸不准、信号对不上、数据稀缺——这三道难题,每解决一道,就是一条护城河。在中国,谁能率先把这些题做出来,谁就拿到了这个赛道真正的入场券。问题是,这件事需要科研能力、真实场景和政策配套同时到位。这三者,浙江恰好都有。
浙江手里,有几张牌
原力无限·小原子,全球首款心智原生小尺寸双足机器人
任福继在报告里专门谈了浙江,判断直接:“浙江完全有条件在情感智能这一黄金赛道率先破局。”这不是客套话。他列出了三张牌。
第一张牌:科研机构的密度。之江实验室、浙江大学、西湖大学、杭州电子科技大学,在情感计算的几乎每一个核心方向上都有布局。这不只是一张名单,而是一条可以快速转化的管道——有条件把基础研究成果迅速变成可验证的原型机,率先实现0到1的突破。更关键的是人才流动机制:浙江出台“双聘”政策,高校情感计算研究者可以直接到企业挂职或自主创业,同步享受企业所在地人才待遇。实验室的人和产业的人,第一次站在了同一个考核周期里。
第二张牌:场景与数据。浙江的电商、文旅、康养场景,是全国最丰富的情感计算训练素材库。任福继说,完全可以训练一个“懂浙江味、懂杭州味”的行业专属情感大模型——这不是比喻,是真实的技术路径。中国美术学院特聘副教授陈小雨的团队在西湖景区、德寿宫落地的AI伴游系统,已积累超过7万条真实用户数据,产品退款率从10%降到2.5%。配套这些场景,浙江还推出了“语料券”政策,企业建设情感标注语料库最高可获30%补贴,余杭区每年另设5000万元专项资金池——情感标注数据成本极高,这一政策直接降低了进入门槛。
第三张牌:政策与时机的共振。这是最难复制的一张。在全国众多省份里,能把“情感计算”相关方向写进省级产业政策的,浙江是少数。2025年出台的人工智能27条措施,从算力补贴到场景开放,再到智能健康终端的消费端拉动,几乎精准覆盖了情感计算产业化的每一个卡点。但更值得关注的是节奏——大模型刚刚为情感理解提供了新的技术底座,算力成本在快速下降,而浙江的配套政策恰在此时密集落地。政策窗口和技术窗口,罕见地在同一时间节点上打开。这种共振,不会一直等着。
更大的图景:“三人”共舞的时代
敢想才能敢做,让我们把视野再放大一点。任福继有一个更宏观的判断:未来社会将是自然人、机器人、数字人“三人共舞”的社会。数字人将承担60%到70%的生产劳动。清华大学发布的《元宇宙发展研究报告3.0版》显示,2021年虚拟数字人核心产业规模约为336亿元,年均增长率31%;研究机构量子位《虚拟数字人深度产业报告》指出,预测到2030年整体市场规模将达到2700亿元。
但“三人共舞”不是技术问题,是情感问题,自然人、机器人、数字人——情感是三人共舞的黏合剂。一个没有情感的机器人或数字人,可以是工具,但无法成为伙伴。任福继团队目前正在积极建设元宇宙中心,以类脑多模态感知与情感计算平台为核心,致力于构建具备真正情感交互能力的"三人"系统。
这对浙江意味着什么?浙江的电商、文旅、康养、教育场景,恰恰是“三人共舞”最先落地的方向。情感计算一旦突破,这些场景将从“用户使用工具”升级为“人与数字伙伴共同生活”——这是一个完全不同量级的产业机会。
窗口,不会永远开着
情感计算面临同样的考验。
西湖大学教授、IEEE Fellow齐国君的复盘值得警醒:Meta把数百亿美元砸进元宇宙,技术没有问题,问题是Horizon Worlds始终找不到一个用户每天真正离不开它的理由。没有高频场景,再好的技术也只是展示品。情感计算同样如此——学术上已经形成共识,政策上已经开始布局,商业场景里已经有了第一批落地案例,但最终能不能跑出来,不只看谁跑得快。
也有研究者持审慎态度。国科大杭州高等研究院研究员李太豪坦言,情感本身是高度情境依赖的,葬礼上的沉默和考后的沉默,信号一模一样,机器未必能分辨,这不是算力能解决的问题。这个提醒,恰恰说明情感计算还有真实的硬仗要打。
任福继提出了一个愿景:“情感智能不只是推动AI更像人,更是推动AI更尊重人。”回到文章开头那位老人。她说“挺好的”,机器信了。如果有一天,机器能听出那句话里的停顿,感知到沉默背后那十四天的等待——那才是情感计算真正落地的时刻。浙江有没有条件让这一天来得更早?牌在手里,关键看怎么打。
来源:省国际民间科技交流中心
责编:叶 扬
美编:陈路漫
一审:何百岳
二审:方佳佳
三审:王陆军
热门跟贴