在2024世界人工智能大会(WAIC 2024)的讨论中,第四范式联合创始人兼总裁胡时伟分享了他对数据与人工智能(AI)关系的独到见解。胡时伟指出,尽管互联网上充斥着大量的文本资源,包括语言、文学作品、科普文章以及维基百科等,AI模型经过充分训练后能够处理这些信息,但这些数据并不能直接转化为复杂技能的学习,比如围棋这种高度策略性的游戏。他以著名围棋选手柯洁李世石的对局为例,说明仅记录胜负结果无法教会AI如何下棋,AI需要的是过程中的每一步决策和思考逻辑。

胡时伟进一步阐述,数据本质上源自人类的生产活动,就如同煤或石油,是数千年来自然积累的结果,但产业界的数据却是在日常运营中持续产生的。他认为,企业每天的经营活动都会产生新的数据,蕴含着尚未被充分挖掘的智慧和经验。然而,许多行业的数据记录并不全面,缺乏将实践中的细节转化为数字资产的能力,这限制了AI在具体业务场景中的学习和应用。

打开网易新闻 查看精彩图片

对于行业大模型而言,胡时伟强调,其数据基础往往不够扎实,尤其在一些产业中,企业的数字化系统仅能记录最基础的信息,而未能捕捉到业务流程中的关键环节。以围棋为例,若要让AI学会下棋,不仅需要知道谁胜谁负,还需要详尽记录每一步棋的走法,甚至是背后的战略考量。因此,AI的真正潜力在于能否将这些细节数据化,并通过模型训练转化为智能决策的能力。

胡时伟的观点突显了AI发展的瓶颈之一:高质量、高颗粒度数据的缺失。这不仅是技术挑战,更是企业管理与数据治理层面的问题。为了推动AI在各行业中的深化应用,企业需要建立更完善的数字化体系,确保能够全面记录并分析业务流程中的每一个细节,从而为AI提供更丰富、更有价值的训练素材,进而促进AI在实际工作场景中的效能提升。