3月7日下午,以“人工智能在出版领域的应用”为主题的远集坊第六十二期活动在京举办。中国出版集团有限公司党组成员,中国出版传媒股份有限公司董事、总经理茅院生,励讯集团中国区高级副总裁张玉国,人民教育出版社党委书记、社长黄强,数传集团CEO施其明,中文在线董事长兼总裁童之磊,中国社会科学院知识产权中心名誉主任、中国法学会知识产权法研究会常务副会长李明德等六位来自产业界、人工智能及法律研究领域的专家学者发表演讲,共同探讨人工智能给出版业带来的机遇与挑战。中国版权协会常务副理事长于慈珂主持了本期活动。

于慈珂主持本期活动

茅院生:未来已来,出版何去何从?

主讲嘉宾 茅院生

中国出版集团是中国最大的大众出版和专业出版集团,茅院生在谈及“AI给出版带来全流程的赋能与提升方面”提到5个创新:创新内容生产、创新翻译与编辑校对、创新营销方式、创新产品形态与服务和创新流程管理。他说,未来出版的形态可预见地将会突破纸质、音像、电子出版物等传统平面或线性载体,向更多维立体的方向发展。AI是企业数字化的重要驱动力,要促进出版行业进一步优化数字要素资源配置,挖掘数据语料化、知识化标引、多模态数据资源等数据的价值。

他讲到,AIGC具有高质量、大规模内容生产和低成本三重特征,一旦Sora等视频生成技术的应用普及,使得纸质阅读受众逐渐减少,传统图书市场会更加艰难,再加上人工智能大模型盈利困难、法律伦理和版权问题难以解决,将会进一步导致出版人才需求的大量下降,传统出版人可能即被替代。茅院生以本集团为例,从中国大百科全书出版社等构建专业语料库、聚焦行业搭建出版垂类大模型、AI技术开发及应用3个方面,讲述了集团在人工智能领域的探索与实践情况,在满足出版行业应用的同时,逐步向水利、农业、材料等方向延展并实现商业化运营。

茅院生讲到,出版业与AI的融合不仅仅是出版业高质量发展的要求,更是生存下去的必要路径。出版行业人员要从思想和行动上主动拥抱AI,从体制和机制上激发内生动力,从资源、资本、技术上推动行业广泛合作,要将AI与本行业本企业结合起来,筑牢数据基础,同时坚持秉承开放、平等、协作、快速、共享的互联网的核心精神。人工智能与出版的融合发展需要全行业精诚协作,开放共赢才能达到理想的发展目标。

张玉国:AI时代,内容为王

主讲嘉宾 张玉国

作为全球领先的专业出版集团,励讯集团已有超过10年应用人工智能的历史,张玉国首先对此做了介绍。他说,在处理文本数据场景下,生成式AI(generative AI)变为热门话题之前,广泛应用的人工智能技术还主要是提取式AI(extractive AI),最典型的应用是搜索、推荐和预测。生成式AI技术自2017年出现后,励讯集团一直密切关注,并已将生成式AI领域推出的应用广布于科研、医学临床和法律行业。比如,爱思唯尔发布临床决策支持工具ClinicalKey AI,帮助医生在临床决策时获得准确、简洁的循证医学信息。

张玉国说,在法律和科研界,生成式AI已经成为提高专业人员工作效率的有用工具,是快捷高效的研究助手和写作助手,在多个方面应用前景广阔。他同时指出,生成式AI技术潜力巨大,但也会带来很多挑战,特别是在幻觉、事实错误、偏见、数据安全和隐私保护、知识产权保护、虚假信息、失业和挑战传统教育等方面。像AI的幻觉问题,生成式AI可能会产生完全捏造的信息,既不准确,也不真实。比如2023年5月,美国《纽约时报》曾报道:一名律师在准备辩护材料的过程中使用了ChatGPT,而后者编造了6个并不存在的司法案例,产生此类问题的根本原因就是训练数据的不完整、不准确、有偏见。AI仍有巨大的局限性,一定不要将AI神话。

对于专业出版机构来说,AI时代还是内容为王,张玉国总结道。出版业因技术而生,随技术变迁和发展,从来不曾畏惧过新技术。高质量、可信任的数据(内容)、对用户需求的深刻理解、先进的技术和平台(负责任的AI原则)将是专业出版的致胜关键,这也是励讯集团20年坚持不变的战略。

黄强:人工智能技术在基础教育出版中的应用与思考

主讲嘉宾 黄强

人教社历来重视新技术对教育出版和教学的积极影响,特别是近年来,人教社积极应用成熟人工智能技术,推进深度融合发展。黄强介绍说,一方面,充分利用人工智能技术助力传统出版。比如,借助各种智能编校手段、建立多种使用人工智能技术的平台和系统、自主研发数字内容版权保护方案等。另一方面,在音像与数字出版中深度使用人工智能技术,构建了人教数字教材、人教基础服务大数据平台、人工智能与教育出版基础平台等。目前,人教社正积极探索生成式人工智能的更多应用方式,建立了人教数字AIGC实验室,积极探索多模态资源生成技术,进行教材编研出版智能化研究,并加强与外界合作。

近期,人教社与中央广播电视总台合作制作的中国首部文生视频AI系列动画片《千秋诗颂》,聚焦国家统编语文教材200多首古代诗词,运用人工智能技术将诗词内容转化制作为唯美的国风动画。在生成式人工智能技术的加持下,高度再现了中国古诗词中的人物造型、场景和道具,呈现了一部将中华古典诗词的博大精深与现代视听艺术相结合的动画作品。

如何更好地利用人工智能技术助力教育出版转型呢?黄强分享了他的三点思考:第一,高度重视AIGC对教育出版带来的可能影响。第二,面对动态发展中的人工智能及其作用和价值,既要积极拥抱,也要客观评估。第三,AI时代的教育出版更加需要在既有的机制流程中发挥专业优势。他说,教育出版人应直面挑战,将传统教育出版优势与新兴技术深度融合,运用人工智能技术赋能教育出版。

施其明:AI+出版融创新未来

主讲嘉宾 施其明

AIGC时代,科技如何赋能加速出版业的数字化与普及化?施其明以数传集团的实践为例,展开其分享。面对科技发展,数传集团调整企业发展战略,致力于深度研发AIGC技术在出版行业的应用,打造了集成“AI编辑工作室”和“RAYS现代纸书平台”BooksGPT为底层大模型的智能服务解决方案,为出版融合全流程解决方案提供了强有力的技术支撑。

施其明说,在数传集团,AIGC已经深度参与出版业的编、印、发等核心环节。比如,“AI编辑工作室”能够提供数字员工助理并深度参与到编辑日常工作流程中,让编辑的工作更高效、更智能。以选题策划为例,2位选题策划数字员工深度参与数智化选题策划选题工作,能够比传统做法提效57%—89%。在数传集团,AIGC已全面且深度参与到了图书出版过程中内容制作、图书审校、发行营销以及“书后服务”各个环节,且完美高效地展现了AI和数字员工的“超能力”。

施其明指出,AIGC的颠覆性变革效力在持续进行中,出版业迎来发展机遇的同时也将面临挑战。他总结道,一方面,现阶段出版物内容同质化风险加大,出版人依然要发挥“把关人”作用,克服算法薄弱环节,确保高质量的生成内容;另一方面,目前知识产权的认定仍存在难度,版权归属认定任重道远,还亟需多方协作共同来维护数字出版市场的良好秩序。

童之磊:AI开启出版新未来

主讲嘉宾 童之磊

童之磊讲道,李强总理在十四届全国人大二次会议上作的政府工作报告中指出,深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。中国正从‘互联网时代’迭代升级为‘人工智能时代’,AI市场规模的全球化将进一步增速发展。

他讲到,AI技术在文字、图像、音频、视频、3D建模、游戏等多领域正逐步落地,涉及图书出版、期刊出版、音乐出版、游戏出版、视频出版等多种出版形态,但同时也给全球知识产权保护带来了新挑战,比如原创性界定难、版权归属模糊、侵权风险增加、法律监管滞后等问题较为突出。目前,国际国内AI立法监管正逐步趋于完善,有效保护和规范数据的合规性。

以本单位为例,童之磊讲到,中文在线用AI释放内容生产力,为创作者提供全创作周期的智能辅助,并发布了全球首个万字创作大模型“中文逍遥”模型。AI主播已可以根据文字故事情节真实语境,生动模拟音色以塑造角色实现文本快速音频化,还可以通过输入文字态的文学作品,由AI模型自动转换成漫画形态,实现IP的跨模态生产力空间。2月29日,中文在线及清华大学元宇宙实验室联合总台央视在中国传统节日“补天节”,创作发布了国内首部AI全流程制作微短剧《补天》。今后,中文在线将全力构建AI+内容的新生态,共启出版行业的新未来。

李明德:人工智能与出版风险

主讲嘉宾 李明德

李明德从作者与作品、人工智能与人工智能生成物、人工智能与作品传播三个方面展开他的演讲。他首先简要回顾了人类文明史和作品创作史,梳理了中外版权法的诞生、发展与立法精神,而后指出,是作者创作作品,作品获得保护,创作作品的自然人是作者。著作权属于作者,法人或者非法人组织视为作者。讨论“人工智能与人工智能生成物”等相关问题,需要重视著作权法的上述基本精神,在此基础上借鉴国际上的成熟做法进行展开。

李明德说,技术的飞速发展对作品数字化、技术措施和权利管理信息保护、网络服务商责任等诸多方面都提出了挑战。但目前业界过多地关注数字化和数字技术问题,而忽视了“以自然人为作者”这个基础和前提。探讨人工智能与作品传播中的风险问题非常重要,需要从相关的作品、表演、录音和广播是否侵权,事先训练的数据库是否侵权,是否在训练软件的过程中侵权,由AI产生的内容是否侵权等多角度关注。就侵权认定而言,他认为,原则上也应当回到“自然人”,以及自然人组成的法人、非法人组织等这些著作权基本框架中来讨论,基本的法律原则并没有根本的改变,主要还是应该由创作者负直接侵权责任、传播者负帮助侵权责任。演讲最后,李明德还呼吁著作权领域的专家学者多关注网络服务商侵权责任,以及如何发挥著作权集体管理组织维权作用等相关问题。

活动现场嘉宾合影

75.3万人通过腾讯、网易、搜狐、爱奇艺、咪咕、优酷、抖音、快手、百度、哔哩哔哩等新媒体平台观看了本期活动的同步直播。