人工智能技术的蓬勃演进将自然语言处理(NLP)推向了科技前沿,这项使计算机具备理解、处理和生成人类语言能力的关键技术,正彻底革新着人机交互方式。作为深耕自然语言处理与数据挖掘领域二十余载的学术领袖,文卫东教授身兼双重使命——既是国家重点研发计划首席科学家,也是"实用主义技术派"创业先锋。2016年创立武汉数博科技以来,他率领团队突破实验室边界,将前沿NLP技术深度融入社会治理实践,成功打造全国首个全链条公平竞争智能审查系统,通过AI赋能助推政府数字化治理迈入新纪元。

01

从“技术控”到“治理赋能者”

作为武汉大学人工智能学院教授,文卫东的职业生涯始终贯穿着一条鲜明的主线——"让代码真正服务于人"。在美国与香港从事研究期间,他观察到海外科研生态中产学研的高度协同:"美国研究人员直接参与企业的科技创新和重大问题突破,他们的课题和研究内容与生产生活紧密相连,高校科研人员在企业兼职的现象也很普遍"这种"接地气"的科研模式令他深受触动。回国后,他在承担国家课题与企业项目的过程中,深刻感受到科研与市场的割裂:“做国家课题时,一些算法模型看似前沿,却与实际生活脱节;做企业课题时,先进技术又难以落地。”

2012年国家"科研服务生产生活"的政策导向,为文卫东埋下创业的种子。历经四年沉淀,这位深耕自然语言处理二十余年的学者,于2016年正式创立数博科技,将目光投向社会治理领域:"政府部门的海量文本数据如同未锻造的玄铁,我们需要用AI将其淬炼成治理利剑。"在武汉大学完成的数十项数据分析课题经验,恰似精密齿轮般与创业构想完美咬合,开启了产学研融合的新篇章。

但创业之路远非坦途。"学者追求理论创新,企业家必须直面现实痛点。"文卫东对角色转换的阵痛记忆犹新。团队耗时半年研发的语义分析模型,通过深度调研,在2000余份政策文件中梳理出12类风险特征图谱,最终将抽象算法转化为可落地的214个审查维度。

相较于美国"旋转门"式的人才流动机制,文卫东探索出独具中国特色的融合路径。作为国家重点研发计划首席科学家,他将国家级课题中的试点场景与公司项目深度耦合,在教学层面,他将企业案例转化为鲜活的课堂素材,带学生在理论结合实际的过程中获得更好的知识和体验,让论文公式与真实数据展开对话。

2024年8月,由数博科技提供技术支撑的湖北省公平竞争审查系统正式上线,半小时生成全国首份说理式会审意见书。“过去政策出台后发现违规,损害已不可逆。现在通过‘AI+协同会审’,相当于给政策制定装上‘安检门’。”文卫东用比喻解释这项突破:“语义识别筛查风险点,知识图谱关联法规库,协同平台整合多方智慧——这就是AI赋能治理的典型场景。”

02

从“垂直百度”到知识引擎

战略转向与认知革命

“最初我们提出‘垂直版百度’的构想,但很快意识到,通用搜索的逻辑无法满足专业场景的深度需求。”文卫东回顾公司战略转型时坦言。

在通用搜索引擎依赖关键词匹配与词频统计难以满足专业场景需求的背景下,文卫东率先提出构建具备语义理解、知识关联与智能推理能力的认知体系。

依托大语言模型的语义解析与知识推理突破,数博科技打造了语音交互、语义搜索与动态知识图谱三位一体的认知中枢,将海量数据转化为标准化知识元数据,构建垂直领域的知识本体。 “数博的语音技术、语义搜索和知识图谱,是让机器像人一样联想和学习的关键。我们通过知识生产、关联形成知识图谱,并建立知识标准体系,为上层业务服务。”文卫东说到,如今,数博科技将核心目标锚定为“领域知识引擎”——通过语义搜索、知识图谱与云技术构建垂直行业的认知中枢。

在社会治理智能化领域,数博科技创新性提出"12345"智能治理框架,即一个目标、两条路径、三种手段、四个中心和五项产品或服务。目标是通过数字化、智能化助力社会治理;路径是纵向信息化流程和横向拓展协同机制;手段是以数字化、网络化和智能化技术为媒介;四个中心包括数据中心、监督中心、分析中心和支撑中心;五项产品或服务涵盖公平竞争审查、12315预警分析、直播监测管理、互联网广告监管和网络交易监测等。这些产品在全国推广,如公平竞争审查系统提高政策发布的科学性,12315大数据预警分析平台提升消费保障水平。

数博科技通过构建"人机协同"系统,推出的协同治理五项产品,包括公平竞争审查、12315的预警分析、直播监测、互联网广告监管和网络交易监测等,这些产品在全国进行推广,其中提到的领域智能云、智能引擎在社会治理、协同治理领域意义重大。数博科技通过了解痛点、问题,已形成示范效应,推动政策审查从被动响应转向主动预防,实现了社会治理模式的革新转型。"最难的不是算法开发,而是建立政府监管逻辑向机器语言的转化通道。"他以12315预警系统为例,该产品将消费投诉响应周期从7天压缩至2小时,关键在于打通政策文本与算法规则的"翻译"机制。

相较于互联网大厂,数博科技依托七年深耕形成的"政策安检门"核心技术体系构建差异化优势,通过实时解析的民生诉求数据流,构建起"语义特征-行业波动-社会情绪"的三维预警模型,深度总结领域数据、业务和法律条款,解决政府公文识别垄断条款等难题。"政策安检门不仅是技术产物,更是治理思维的数字化投射。"文卫东强调。这种将人类专家经验转化为动态进化的数字认知体系的实践,正在重塑政府决策的底层逻辑——从依赖个体经验判断转向基于群体智能的认知计算,使数博在数字政府赛道开辟出技术重构治理范式的新路径。

03

技术商业化的平衡术

从实验室到产业落地

"将学霸团队转化为商业铁军,本质是场认知重构。"文卫东回顾团队转型时直言,"当90%成员来自顶尖高校,我们曾陷入技术至上误区——执着于参数优化却忽视真实场景。"这一认知在金融领域试错后彻底扭转,同行"行业选择决定生死"的忠告促使团队重新锚定方向:"技术价值不在实验室的完美模型里,团队的首要目标是满足市场需求,解决用户问题。所有的技术都是围绕需求来服务的,只有把用户的痛点问题妥善解决,产品才能拥有生命力。" 这种“浸泡式”的行业理解成为数博方法论的核心,让技术扎根于具体场景,当知识引擎转化为解决监管预警、消费保障等民生问题的利器时,技术商业化完成了从概念到价值的跨越,其本质是让技术创新在市场需求与社会责任之间找到可持续的成长空间。

面对ChatGPT、Deepseek等大模型冲击,文卫东展现了清醒的战略定力:通用大模型在垂直领域的理解局限恰恰创造了机会窗口。数博科技的突破口在于深耕细分领域,通过长期投入构建知识体系形成竞争壁垒。这种基于行业深度理解的知识资产难以被快速复制,正如文卫东所言:“通用大模型像百科全书,我们要做专业词典。”

关于技术开放战略,文卫东展现清晰路径:"领域智能知识引擎既是核心武器,也要成为行业基础设施。"该引擎作为中间件,已支撑起协同治理五项产品矩阵,同时通过接口开放赋能中小企业。"我们正在将知识生产能力封装为标准模块,未来部分功能将免费开放,让更多企业能在垂直领域快速构建解决方案。"

当被问及"给2016年刚创业的自己建议",文卫东的回答简练有力:必须深入行业肌理,与客户共同解构业务逻辑。"人工智能终将回归工具本质。我的理想始终未变——让技术从实验室,走进中国社会治理的毛细血管。"这位学者型企业家正"带领团队践行"不做摩天大楼建造者,只做称手工具递送者的愿景,在数字化治理浪潮中书写新的答卷。