《中华人民共和国国民经济和社会发展第十五个五年规划纲要》强调,“加快探索人工智能驱动的新型科研范式”。国务院《关于深入实施“人工智能+”行动的意见》明确提出,要“推动哲学社会科学研究方法向人机协同模式转变,探索建立适应人工智能时代的新型哲学社会科学研究组织形式”。在这场AI4SS(AI for Social Science)的时代潮流中,相继涌现的法律、伦理、金融和教育等哲学社会科学垂域大模型为推动研究方法、教学形态与知识组织方式的系统性重构提供了全新的可能,展现出数智时代技术理性与学科理性深度融合的前沿图景。
哲学社会科学 垂域大模型正在改变知识的存在形态 图片来源:东方IC
哲学社会科学垂域大模型的多元涌现
近年来,通用大模型技术随着参数规模的扩大和计算能力的提升不断成熟,并在各行各业加速扩散。以特定领域需求为导向的哲学社会科学垂域大模型也呈现出多元涌现的良好态势。作为原始创新和关键技术突破的重要策源地,高校正逐渐成为推动哲学社会科学垂域大模型发展的主导力量之一。在法律领域,清华大学、复旦大学、浙江大学、山东大学、东南大学等高校先后发布“PowerLawGLM”“DISC-LawLLM”“智海·录问”“夫子·明察”“法衡”等法律垂域大模型,吹响了法律人工智能由分析式向生成式转型的时代号角。在金融领域,上海财经大学研发的“匡时财经教育大模型”和中央财经大学推出的“中财融通大模型”,均体现出对金融知识推理能力与安全合规要求的高度重视。在教育领域,教育垂域大模型的研发聚焦教学规律、学习过程与育人目标的整体协同,典型代表如北京师范大学的“师承万象”基础教育大模型。在伦理领域,东南大学发布的系统级伦理垂域大模型“问道”,以伦理风险识别、伦理规范建模与伦理价值对齐为核心,探索将伦理原则系统化嵌入大模型运行过程。
通用大模型向垂域大模型的演进,体现为通用技术“先发启蒙”与专用技术“后发适应”之间的动态互动。随着垂域大模型在训练与应用中持续吸收专业知识,其在具体情境中的优势逐渐显现,在一定程度上弥补了通用大模型在专业判断上的不足,并重塑了特定领域的知识生产边界。这种通专互动的协同共进关系,有助于提升大模型应对复杂问题的整体能力,拓展技术发展的公共价值空间。
哲学社会科学垂域大模型的技术范式
从技术路径看,哲学社会科学垂域大模型的研发大体可以归纳为“由通到专”和“由专到专”两种基本范式。前者是指以通用基座模型为基础,通过引入特定垂域语料进行自适应预训练,并结合任务导向的微调机制,实现垂域知识迁移与任务适配的垂域增强路径。自适应预训练使模型掌握垂域特有语言风格、术语和逻辑结构,微调则通过标注数据强化特定垂域任务的推理与生成能力。该范式优势在于资源效率高、开发周期短、跨域适配性强,且通用能力可继承适用。相比之下,后者的全量训练范式是从零构建的垂域原生模型,强调模型结构与参数的根本性优化,使专业逻辑深度嵌入模型表征,充分体现垂域规则与推理范式。但由于其通用性和扩展性受限,因此对高质量垂域数据和长期训练资源依赖显著。综合现实情况看,我国哲学社会科学垂域大模型的发展主要采用“由通到专”的范式。
此外,在实践中被广泛采用的还有检索增强生成(RAG),即通过挂载高质量垂域知识库,遵循“检索—阅读—生成”的机制,确保大模型可以根据可靠的垂域知识进行应答,从而提升内容在特定垂域的准确性和可溯源性。尽管RAG能够不同程度提升模型的垂域表现,但相较于“由通到专”“由专到专”的内嵌式改变,这种外挂式增强一般不触及大模型自身对领域知识的理解能力,也未从根本上改变大模型在特定领域的内部知识表征与推理方式,应被视作一种轻量化的垂域优化范式。
哲学社会科学垂域大模型的赋能潜力
哲学社会科学垂域大模型正在改变知识的存在形态。传统哲学社会科学知识多以文本形式分散于不同学科与资料系统之中,研究者往往需要投入大量时间与精力,依靠长期的个人阅读积累与经验判断才能完成知识整合。垂域大模型通过对大规模专业语料的系统性训练与专业性标注,将原本静态、碎片化的知识转化为具有内在结构与关联关系的整体表征,使知识呈现出动态更新、相互联结的形态,为跨领域分析提供了前提条件。更进一步,垂域大模型通过持续的人机交互,对哲学社会科学的研究路径产生了实质影响。在假设生成环节,模型能够在系统梳理既有研究的基础上,从海量数据中识别出尚未被充分讨论但具有研究前提的方向,为研究提供具有解释潜力的判断起点;在理论推演环节,模型可以将既有理论置于不同语境和价值设定下进行逻辑链条的延展,对不同假设条件下的适用边界与可能结果展开推演。
上述知识生产方式的变化正在对哲学社会科学研究方式与教育实践产生直接影响。在科研层面,哲学社会科学垂域大模型在遵循学术规范与形式可解释性要求的前提下,可以帮助研究者更高效地梳理理论脉络、跟踪学术前沿,并开展系统化研究工作。以历史研究为例,学者高度依赖原始文献的搜集、辨伪与考据,研究效率严重受限于个体阅读速度与知识积累。垂域大模型的出现则有望辅助史料预处理、知识抽取、宏观分析与微观考据。在教学层面,哲学社会科学垂域大模型通过知识梳理、案例分析、研究支持、情境模拟与写作辅导等功能,为学生提供更加自主式、个性化的学习方式。学生在持续的提问与反馈中完成知识内化与能力提升。
跨学科推进哲学社会科学垂域大模型的研发与应用
一是聚焦领域知识生产与应用的特殊需求,研发一批具有学科特色的哲学社会科学垂域大模型。这需要打破学科壁垒,建立由哲学社会科学专家、计算机科学家、数据工程师等组成的文工交叉团队与长期协作网络。与此同时,应当加大哲学社会科学专用高性能算力资源池的投入,优化算力资源的统一调度与按需分配机制,保障哲学社会科学垂域大模型训练等科研任务的计算需求。更进一步,系统整合历史文献、社会调查、法律案例、语言文化等多源异构数据,建设标准统一、互联互通的哲学社会科学基础数据库与专题语料库,并坚持“研发—应用—转化”一体推进的思路,探索建立哲学社会科学垂域大模型的市场化转化机制,形成可持续的文工交叉产学研用协同创新生态。
二是面向垂域大模型赋能的场景拓展,实质提升哲学社会科学工作者的大模型素养。这种素养不仅指向工具运用,更关乎人机协作意义上知识生产转型。其本质是哲学社会科学思维与计算机科学思维的跨学科对话与方法论重构。哲学社会科学工作者需要有序探索文科垂域大模型在知识跨学科整合、复杂问题建模与推演、理论启发与验证等方面的辅助作用,将人工智能知识工具逐步嵌入假设生成、逻辑论证与经验验证的生命周期,不断提升垂域大模型在哲学社会科学创新发展中的应用深度。
三是正视知识幻觉、价值偏差、学术失范等潜在风险,建立健全哲学社会科学垂域大模型的应用规范。这不仅要求跨学科强化哲学社会科学垂域大模型治理,重点防范垂域知识幻觉、垂域价值对齐等方面的风险,更需要建立针对利用大模型伪造数据或进行实质性代写等学术不端行为的检测与惩戒机制。唯有如此,方能形成垂域大模型与哲学社会科学双向赋能、健康可持续的融合发展路径。
作者系东南大学法学院教授、未来法治与数智技术创新实验室研究员
来源:中国社会科学报
责任编辑:王博
新媒体编辑:宗敏
如需交流可联系我们
热门跟贴