打开网易新闻 查看精彩图片

袁煜,上海海事大学副教授、硕士生导师。英国利兹大学哲学博士(计算语言学)、硕士(外国语言学及应用语言学)、学士(英语)。兼任数家国外翻译学SSCI期刊匿名评审、计算语言学国际会议审稿人(如ACL Rolling Review (2020,2021)、LREC(2020))。个人主要研究领域为计算语言学和语言技术,专注于语言使用者加工过程和语言产出(例如翻译)的计算机建模,有近十年的面向语言研究的应用机器学习开发与应用经验。

打开网易新闻 查看精彩图片

刘世界:袁煜老师您好,非常开心有机会邀请您进行此次专访。我了解到您虽然是MTI方向的导师,但是您的研究方向却是很多MTI学生,甚至是外国语言文学的硕士和博士都很难去下定决心去深挖的,您能和我们分享一下您现在的研究兴趣和主要的研究领域吗?

袁煜老师:谢谢世界的邀请,我简要说一下我的研究兴趣和主要研究领域。我大一点的方向是计算语言学,由于先前的翻译研究背景,所以我的研究方向和翻译结合非常紧密,我的博士论文项目做的是人工翻译质量的自动评估问题,主要是将机器学习方法应用于语言研究。虽然我们的研究工作不断变化,其实本质没有多大差别,都是使用计算机工具解决人类语言的加工和产出问题。

刘世界:在与您日常交流的过程中,我了解到您本科和硕士研究生期间的学习与研究方向也是比较偏人文社科,而现在更多的是偏向语言技术,是什么原因让您在博士期间及此后的研究方向有了这么大的转变?

袁煜老师:好的,我非常乐意和大家交流自己的学习体会。作为一名文科生,我学习语言技术的经历其实可以用几个词概括:挑战、热爱(兴趣)、坚持

首先,我想简要地回顾一下我的学术成长经历。2004年硕士研究生毕业后入职南京一所高校,那时对学术研究完全没有什么概念。2008年开始我对语料库方法特别感兴趣,很快熟悉各种语料库工具方法,但学术研究仍然十分迷茫。2009—2012间断断续续试图通过考博提高自己,由于方法不当,暂未遂愿。由此萌生申请攻读国外高校博士念头,并最终获得奖学金和留基委的生活资助,得以离自己的学术梦想更近一步。

其次,我谈谈自己的学术方向转变。我起初的研究计划选题是偏向于语料库文体学的研究,但就在我到达利兹大学的第二天下午见到两位导师之后就改变了。我记得导师当时给我大致说"我做语料库研究,我的很多研究也会用到语料库,但我想你也许注意到同时我的很多研究是偏计算的。根据我刚才的了解,如果你继续做语料库研究的话,你需要学的东西很少了,但是如果选择做偏计算的,你要学的东西似乎还有很多。" 可能是由于刚读博的兴奋,我想也没有想就说,我想挑战自己,不想待在自己的舒适区。就这样,我开始了自己的跨方向之旅。

当然,跨专业方向的学习其实并不轻松。重要的是我们得把原先缺失的知识板块补上,所以读博的前几年我感觉自已都是打基础。主要是恶补编程、自然语言处理、机器学习理论与方法方面的知识。英国的博士没有课程学习,我在导师建议下选修了数门计算机学科、和自己方向接近的或认为对自己的博士项目有用的本科、硕士研究生课程,余下更多时间是根据论文进度和导师反馈按需学习,边干边学。总结一下, 兴趣是最好的老师。我比较认可计算语言学(自然语言处理)方向,认可这个方向的研究范式,所以再难也不觉得难;坚持亦难能可贵,身边的人做自原先己熟悉的领域,会相对轻松许多,有时候你也会产生疑问,自己这么做到底值不值?坚持自己的选择,相信技多不压身真的很重要。

刘世界:据了解目前上海海事大学外国语学院MTI学生课程中也在讨论如何开设NLP相关的课程,您能否可以谈谈个人的看法?

袁煜老师:关于给MTI学生开设NLP课程,我想谈三点个人的想法:

第一,授课性质问题。既然MTI学生属于专业硕士,职业倾向明显,那么面向他们的NLP课程非常有必要,对提高他们将来的职业水平和工作效率大有裨益。这种学科交叉深度受限于学校发展理念和师资水平,欧洲一些大学设有语言技术(或类似)硕士,且分文理两种类型,显然是认识到语言与技术结合的重要性。

第二,授课内容问题。理想情况下,是自然语言处理基础课程与专题课程并重,但受限于国内MTI教学大纲的设置,开设相关的NLP课程很难系统化,学时有限,内容必然有所取舍,课程设置应该结合理论和实践,注重培养学生的问题解决能力和实际应用能力,因此,如何分配自然语言处理基础、机器学习和统计方法、深度学习与自然语言处理这几大模块是比较考验老师和学生的。

第三,授课资质问题。在此特别申明一点,我不反对纯计算机科学背景教师来给MTI学生教授自然语言处理课程。我的思考是授课教师最好有语言学和文学背景,这不仅可以帮助授课教师更好地解释自然语言处理的理论和方法,而且能将其与语言学和文学的相关概念和理论联系起来。同时授课教师需要具备计算机科学和人工智能背景,他们应该熟悉编程语言、机器学习算法和统计方法,能够解释和应用这些技术在自然语言处理中的作用。至于实践经验和教学能力自然就不必多说了。

刘世界:在AIGC时代背景下,ChatGPT等AI产品在多个领域中大展拳脚,应用场景不断拓展,翻译技术也迎来了巨大的发展机遇。您能否分享一下您对当前翻译技术发展的看法?面对技术的不断革新,我们应该如何应对和利用这些技术?

袁煜老师:关于翻译技术,我分享一点我个人的亲身经历。

2013年我读博的时候,那个时候统计机器翻译还是主流。为什么这么说呢?那一时期,我在导师要求下,需要使用代码复现很多他人研究中的实验,尤其是当时关于机器翻译质量评估的研究成果都和Moses机器翻译系统有关

结果一个学期不到,2014一篇"Neural Machine Translation by Jointly Learning to Align and Translate"论文出来,整个自然语言处理(或计算语言学)学界为之沸腾。又一年之后大厂神经网络机器翻译引擎纷纷上线,彼时神经网络机器翻译系统经常闹各种令人啼笑皆非的笑语,当时语言学界和自然语言处理领域均很乐观,前者觉得大可不必担心有一天会被机器取代,后者看到了end-to-end机器翻译的高效。

随着Transformer类大模型的不断发布,2018之后开始听到各种"human parity"的声音和争论。随着OpenAI大力出奇迹,ChatGPT 又一次把"human parity"的问题推到风口浪尖,社会上和朋友圈言必称ChatGPT,各种贩卖危机的言论甚嚣尘上,甚至将高考志愿填报和毕业生就业这种综合因素很多的社会现象和它也挂上钩。这就是我对翻译技术的直观体验。

那么,我怎么想的呢?我想技术进步日新月异,终归是为人服务的,与其担心被取代,还不如想想怎么用好这些技术,去积极拥抱技术。其次,ChatGPT之类的生成式AI针对很多任务进行了微调,因而性能优异,单就机器翻译而言,一些比较研究表明它并非能在所有领域能取得SOTA(State of the Art)成绩。

最后,退一步讲,随着人类科技水平的提高,翻译技术的进步也是理所应当的。所以,在技术飞速革新与发展的背景下,我们更应该以开放的态度去接纳技术、运用技术,使其为我们所关注的领域赋能。

专访记者:刘世界(Ethan_LSJ)

推送编辑:Ethan_LSJ