大家好,我是人月聊IT。
今天继续聊本体建模,实际我今天重点今天还是想接着再分享一下对于未来软件形态的一个构想。其核心就是:
本体模型+大模型驱动的AI原生应用。
因为3月9号的时候,我就发过一个视频,谈到了未来软件的终极形态。很有可能就是本体模型加 AI 大模型加 IM 的这么一个入口。今天进一步对这个思路进行说明。
在今天我们一个CIO群里面,我讲了如下一段话,谈到了为何本体是构建AI原生的核心基础。如下:
传统的数字化即已经有了现实世界,和虚拟数字世界,然后再找方法将其粘合为一个整体。类似当前已有IT系统上面增加AI赋能全部是这个模式,包括palantir本体论也是这个思路,即构建本体来打通数据到业务。也就是树都长出来了,你来将枝叶缝合到一起,这个不能叫AI原生。新的本体+AI的思路是一开始就构建底层的本体模型,本体模型一方面支撑IT应用构建,一方面又为后续虚拟世界到现实世界的连接构建了足够的业务语义,方面自然语言的交互。大家都是从树根长出来了,天然就是融合一体的,完全不需要后天粘合。为何AI大模型没出来前这个思路不行,类似企业架构本身也体现本体思想,但是一到后面落地就变成了4A架构,因为对于太大组织或系统,为了方便人解决问题必须分解,但是分解自然就带来了集成的问题。
本体模型生成和可视化编辑
其实在3.9日的时候,已经录过一个视频,讲我的本体模型编辑器。这个本体模型编辑器里面就包括了对象模型,行为模型,规则模型,事件模型,场景模型。
在对象模型里面就有类似于产品,客户,人员,合同各种对象。 每个对象它都有相关的属性和行为,类似于合同对象就有录入合同,关闭合同,查询合同列表。而对于规则模型是单独剥离的一个业务规则。既有类似于参数完整性校验的规则,也有复杂的业务处理关联多个对象的规则。在规则模型下面还有相应的事件模型,通过消息机制实现解耦。而最后场景模型大家就可以理解成业务流程或者是业务功能,它实现底层相关的对象行为规则的灵活组装和编排。
这么一个本体模型怎么样得来的?
它其实就是基于初步的原始需求,在 AI 大模型辅助下面得到了这么一个本体模型。大家可以把这个本体模型理解为我们传统的软件需求加核心的软件架构设计文档的一个完整融合。既然它是一个完整的融合,那我们是不是可以构想这么一个本体模型,它是可以驱动 AI 大模型去生成完整的应用的。
那基于这个本体模型,我们生成的完整应用。在我早期的思考里面,我的思考是应该将这个本体模型,对接到我们的低代码平台。将本体模型的数据导入到低代码平台的原模型原数据, 然后让低代码平台去构建生成上层的应用。
本体驱动AI原生应用
但是这不是未来软件的一个关键的形态。我一直在强调未来软件的形态,它是 AI 原生应用。再具体一点,它就是本体模型驱动的 AI 原生应用。你应该看不到一个完整的业务系统, 而是一个由 IM 自然语言对话,结合本体模型大模型实现的一个语义交互系统,这个就是我们核心的终极的构想。
所以很多人也会问,那对于合同表单录入,我还没有完全去实现 AI 自己录入的时候,我不是还需要人和他交互吗? 所以在这个时候,任何一个系统,特别是涉及到录入变更的这么一些功能,我在前期可能仍然有一些为了方便人为录入的标准表单页面,但是到了后期,这一些东西也有可能完全不存在。
基于刚才的构想,我们做了一个简单的原型。比如就是拿我最早的合同管理原始需求,我就会最后展现的一个业务系统, 就是大家现在看到的这么一个界面。
首先左边是有会话,你可以去建各种各样的会话。然后中间其实就是一个类似于 IM 的 AI 聊天对话框,它以后有可能就集成在类似于我们的飞书 QQ 微信的各种聊天通道上面。我们对功能的使用就是通过和机器人聊天来完成的。
我们举一个简单的例子,比如说我现在要查上周的合同,这个时候 AI 就会输出完整的合同信息。给我上周共签署了三份合同,总金额是多少。当然你觉得这个合同查询的显示的内容不足够, 那我们就可以打开完整的查询界面,那么这个查询界面就是我们提前内置的一个 UI 模板,它去生成这么一个动态的查询界面。 基于查询界面,你就可以查询到更完整,更详细的合同信息。
我们如果还有一个需求是录入一个新合同,那么对于录入合同这个时候大家一定要注意录入合同,其实对相关的数据字段参考完整性的校验的规则要求相当复杂。你简单的通过自然语言对话不太好完成。所以说当他遇到录入合同界面的时候,就直接在右侧打开一个合同录入的界面,让你去完成整个合同的录入。包括具体的产品部门,市场负责人在录入完合同以后,我们再点击保存合同,这个合同就录入进去了。
还有一些最简单的合同对话,类似于华远合同由谁负责?这个时候就不会在右边有任何可操作的界面打开,直接在 AI 聊天助理里面通过 AI 大模型,它就会告诉你这个合同是由谁负责,包括合同查询也是一样的道理。所以说基于我刚才讲的,大家可以看到我们未来的软件形态很有可能就是这种本体加 AI 驱动的轻应用。
我们传统复杂的类似于 CRM ERP 这些系统,我们有可能把外围的很多东西都拆分成一个小模块。这些小模块就会变成在和你的 IM 聊天工具和大模型结合下的一个数字操作的机器人,这个其实就是对未来软件很重要的一个构想。当然在前面我也出了整个本体编辑的模型也形成了一个完整的本体模型。
接着我们来看下AI辅助下进行的关键方案设计。
一种以语义为核心、以本体为骨架、以自然语言为主交互路径的软件新范式一、从一个根本性问题出发
软件工程发展了数十年,从汇编到高级语言,从瀑布到敏捷,从单体到微服务,每一次范式跃迁的本质都是在降低"人的意图"转化为"机器执行"的摩擦成本。但有一个根本性摩擦始终存在:业务语义和代码实现之间的鸿沟。
业务专家用自然语言描述需求,开发者把它翻译成代码,这个翻译过程充满歧义、损耗和风险。需求文档与实际实现的偏差是软件项目失败的头号原因。更深层的问题是:传统软件的交互核心是 UI 表单,用户必须学会操作软件,而不是软件理解用户。
AI 大模型的出现让一种新的可能性浮现:如果软件的业务语义被精确地形式化,AI 是否可以成为软件的执行层,而不只是辅助开发的工具?
本文提出的"本体模型 + AI 大模型驱动的 AI 原生应用"范式,正是对这个问题的系统性回答。
二、核心思路:三层飞轮
这一范式的整体架构由三个紧密咬合的层次构成,形成一个自上而下的驱动链条。
如图一所示,平台分为三个核心层次:
第一层是语义建模层,这是整个平台的起点和大脑。它包含三个子系统:语义对话引擎、本体抽取引擎和模型协作工作台。语义对话引擎负责与业务专家进行多轮自然语言对话,其核心能力不是简单地"记录需求",而是主动识别潜在歧义、追问边界条件、提取结构化的业务语义。本体抽取引擎接收澄清后的语义,自动生成符合规范的本体元文件——包括 M1 对象模型、M2 行为模型、M3 规则模型、M4 场景模型、M5 主体模型,并执行跨模型的一致性校验与自动补全。模型协作工作台则提供可视化的人机协同审查界面,让业务专家和技术人员可以共同确认模型定义,并管理模型的版本演进。
第二层是模型驱动生成层,它是本体元文件到可运行代码的转换引擎。这一层并不是通用的代码生成器,而是严格遵循本体语义的定向生成器:数据层生成器从 M1 对象模型派生数据库 Schema、ORM 配置和索引策略;服务层生成器从 M2 行为模型派生接口骨架、规则注入点和事件总线接入代码;权限层生成器从 M5 主体模型派生 RBAC 策略文件和 ABAC 条件映射;交互层生成器从 M4 场景模型派生意图路由脚本、对话流骨架和轻 UI 组件。所有生成产物均携带溯源标签,指向其来源的本体模型节点,使得后续的变更影响分析成为可能。
第三层是 AI 原生应用运行层,这是最终面向用户的应用形态。它由语义交互运行时、本体感知执行引擎和轻 UI 自适应层三部分构成。这一层的核心是重新定义了人机交互的主路径:自然语言意图是主交互方式,传统 UI 界面退为辅助性的数据呈现和操作确认手段。
三层之间的驱动关系是单向的:语义建模层产出本体元文件,模型驱动层消费元文件产出应用骨架,运行层基于骨架运行并服务用户。但模型的演进是双向的——用户在运行时提出的新需求,可以反馈回语义建模层,触发模型的增量更新和代码的局部重生成。
三、从自然语言到运行中的应用:端到端流程
理解了分层架构之后,我们来看一次完整的从需求输入到应用运行的全程流转。
如图二所示,整个流程分为六个关键节点:
节点一:业务需求输入。 业务专家用自然语言描述需求,例如"我需要一个合同管理系统,支持开票和收款跟踪"。这句话信息密度低,存在大量隐含假设。
节点二:语义对话引擎多轮澄清。 语义对话引擎不会直接尝试从这句话生成模型,而是主动提问:合同有哪些核心属性?一个合同可以对应多个付款阶段吗?开票和付款阶段是什么关系——一个付款阶段只能开一次票,还是可以多次?谁有权限录入合同,谁有权限关闭合同?通过若干轮澄清,业务专家的隐性知识被显式化。
节点三:本体抽取引擎生成 M1–M5 元文件。 基于澄清后的结构化语义,本体抽取引擎自动生成五个本体元文件。以合同管理为例,M1 对象模型会识别出合同、付款条款、开票明细、开票付款条款映射四个核心实体,以及产品、客户、部门、人员四个支撑域实体,并定义其间的组合、聚合、关联关系;M2 行为模型会定义录入合同、关闭合同、录入开票、录入收款等九个原子行为;M3 规则模型会提取税率合规校验、累计开票上限校验等七条可复用业务规则;M4 场景模型会组装五个业务用例和一个履约回款业务流程;M5 主体模型会定义销售人员、财务人员、部门经理、合同管理员四个角色及其权限边界。
节点四:人机协同审查与确认。 生成的本体元文件在模型协作工作台中以知识图谱形式可视化呈现。业务专家确认实体关系是否正确,技术人员审查约束条件是否完整,双方协同修正后确认发布。这是人工智能与人类判断力的协作节点,也是确保模型质量的关键门控。
节点五:模型驱动代码生成。 确认后的本体元文件进入代码生成引擎,自动产出数据层、服务层、权限层和交互层的代码骨架。所有产物携带溯源标签,例如"此接口来源于 M2 行为 Contract_Create,对应前置条件 PERM-CON-CREATE"。
节点六:AI 原生应用运行。 应用骨架在 AI 原生运行时中启动,用户通过自然语言与系统交互。系统按照意图理解→本体路由→行为执行→语义响应的流程处理每一次用户输入,必要时以轻 UI 形式呈现数据卡片或操作确认面板。
四、AI 原生应用的新形态
这一范式最终呈现给用户的应用,与传统软件应用在形态上有根本性差异。
如图三所示,传统软件应用的交互逻辑是"UI 表单→操作点击→后端处理",用户必须学习软件提供的操作路径,通过菜单导航找到功能,填写表单提交数据。软件是主体,用户适应软件。
AI 原生应用的交互逻辑完全倒转:用户用自然语言表达意图,系统理解意图并直接执行,结果以最合适的形式呈现。软件适应用户。
图三的下半部分展示了这一新形态的核心运行机制,由四个层次串联:
意图识别层接收用户的自然语言输入,执行意图分类、实体提取和权限预检。例如用户输入"帮我查一下张三负责的合同里有没有未收款的开票",系统识别出这是一个查询意图,涉及的实体是合同(过滤条件:责任人=张三)和开票明细(过滤条件:isReceived=false)。
本体路由器把识别出的意图映射到本体模型中的具体行为。在本例中,它会匹配到 Contract_QueryDetail 和 Invoice_QueryList 两个 QUERY 行为,加载 RULE-CON-004 数据权限过滤规则,检查当前用户是否具备 PERM-CON-QUERY 权限,生成执行计划。
本体感知执行引擎按照执行计划调用原子行为,执行业务规则,在必要时触发事件链,保障数据一致性。
轻 UI 自适应响应层接收执行结果,决定以何种形式响应:如果结果简单,直接用自然语言回答;如果涉及列表数据,渲染数据卡片;如果需要用户确认敏感操作,弹出确认面板;如果存在异常,给出告警提示和建议的下一步操作。
这种设计的核心价值在于:UI 不再是主要的交互路径,而是执行结果的辅助呈现方式。这让应用的学习成本趋近于零——用户只需要用自然语言描述他想做什么,系统负责找到正确的执行路径。
五、风险分析与应对策略
这一范式尽管前景清晰,但在工程落地层面存在若干深水区,需要在推进前做出清醒的评估和应对设计。
5.1 语义歧义的系统性消解风险
业务需求天然模糊,同一句话在不同的组织文化和业务上下文中含义迥异。AI 对话引擎可能在未充分澄清的情况下就生成了看似合理但实际有偏差的本体模型,而这种偏差在后期的代码生成阶段会被放大。
应对策略:在语义对话引擎中引入"歧义置信度"机制,对每个抽取出的实体、关系和约束标注置信度分值,低于阈值的节点强制触发人工确认流程。同时建立领域本体库,为常见业务领域(合同、采购、人力资源等)预置基础本体模板,减少从零生成的不确定性。
5.2 本体模型完备性的保证风险
AI 生成的本体模型可能存在结构缺失,例如忘记为有状态变更的行为定义事件,或者遗漏跨实体的完整性约束。这些缺失在应用运行阶段会表现为业务逻辑漏洞,难以定位根因。
应对策略:建立基于规范的模型完备性校验引擎,类似编译器的静态分析,在模型生成后自动执行一组检查规则:每个 COMMAND 行为是否定义了 producedEvents;每个跨实体引用是否定义了对应的 FOREIGN_KEY 约束;M4 场景中引用的行为是否都存在于 M2 中;等等。校验失败的项目生成具体的修复建议,而不是简单的错误报告。
5.3 意图路由的精确性风险
用户的自然语言表达和本体模型中定义的行为之间的语义匹配,是运行时最核心的挑战。当意图描述模糊时,系统可能路由到错误的行为,导致不预期的数据变更。在涉及写操作的场景下,这个风险尤为严重。
应对策略:对所有 COMMAND 类行为的执行,在语义匹配置信度低于阈值时,强制进入"意图确认"流程——系统用自然语言描述它理解到的操作意图和预期的状态变更,要求用户明确确认后才执行。QUERY 类行为因为是只读的,可以允许更低的确认门槛。同时建立运行时的操作日志,记录每次意图→路由→执行的完整链路,为问题追踪和模型优化提供数据基础。
5.4 本体模型增量演进的复杂性风险
业务需求必然持续变化。当业务提出"给合同加一个审批流程"时,这涉及到 M1 增加状态、M2 增加行为、M4 增加场景、M5 增加权限的联动变更,以及已有代码的局部重生成和数据库的迁移脚本生成。协调这些联动变更的复杂度随着模型规模线性增长。
应对策略:建立模型变更影响分析机制,任何一个模型节点的变更都能自动推导出影响到的其他节点,生成完整的变更影响图,供人工审查确认范围。代码生成采用模块化策略,确保局部模型变更只触发对应模块的重生成,而不是全量重建。同时为数据库迁移建立版本化管理机制,每次模型变更对应一个可回滚的迁移脚本。
5.5 传统系统整合的边界风险
大多数真实的业务场景不是从零开始的绿地项目,而是需要与现有系统整合。现有系统的数据模型和本体模型之间的映射,以及接口协议的适配,是平台能否落地到真实企业环境的关键障碍。
应对策略:在 M5 主体模型的 ExternalEntity 设计中预留充分的外部系统集成语义,支持 REST、MQ、gRPC 等多种协议的接口契约定义。同时提供"反向本体化"能力——能够读取现有系统的数据库 Schema 或 API 文档,辅助生成对应的本体模型片段,作为整合的起点。
六、具体实施演进路径
考虑到这一范式的复杂性和新颖性,建议采用"小步验证、逐层构建"的演进策略,分四个阶段推进。
阶段一:链路验证期(1–3 个月)
目标:以合同管理系统为具体用例,手工走通从需求到本体模型到代码骨架的完整链路,验证本体元文件作为"中间态"的可行性和代码生成产物的质量下限。
关键动作:将已完成的合同管理 M1–M5 本体元文件作为输入,手工(或借助现有 AI 工具)生成数据层、服务层、权限层的代码骨架;测量生成产物的可用率——即从生成到可运行需要多少人工修正工作量;确定本体元文件需要扩充哪些字段才能支撑更精确的代码生成。
验证指标:代码骨架的人工修正量低于 30%;生成的 RBAC 策略文件与手工设计的权限矩阵一致性达到 90% 以上。
阶段二:语义建模层构建期(3–6 个月)
目标:开发语义对话引擎和本体抽取引擎,实现从自然语言对话到本体元文件的自动化生成,并构建模型完备性校验引擎。
关键动作:设计并实现语义对话的提示工程框架,包括领域知识注入、歧义识别和澄清问题生成;实现本体元文件的自动生成和格式规范化;开发基于规范的完备性校验器,覆盖跨模型引用检查、约束完整性检查等核心规则;构建模型协作工作台的基础版本,支持 YAML 可视化编辑和版本对比。
验证指标:对于中等复杂度的业务需求(10–15 个实体,30 个以上行为),语义对话引擎生成的本体元文件经过人工审查后修正量低于 20%;完备性校验器能自动发现 80% 以上的模型结构缺陷。
阶段三:运行时与生成引擎构建期(6–12 个月)
目标:构建模型驱动代码生成引擎和 AI 原生应用运行时,实现从本体元文件到可运行 AI 原生应用的完整通路。
关键动作:实现四个代码生成器(数据层、服务层、权限层、交互层),支持主流技术栈(如 Spring Boot + PostgreSQL + React);开发本体感知执行引擎,实现意图→行为的语义路由、规则执行和事件链调度;构建轻 UI 自适应层,支持数据卡片、确认面板等基础组件的按需渲染;实现运行时的操作日志和溯源追踪机制。
验证指标:以合同管理系统为基准,从本体元文件到可演示的 AI 原生应用,端到端时间低于 8 小时;语义路由在常见业务操作场景下的准确率达到 90% 以上。
阶段四:平台化与生态构建期(12 个月以后)
目标:将以上能力平台化,支持多业务域、多团队协作,构建本体模型库和行业模板生态。
关键动作:构建本体模型注册中心,支持跨域模型的引用和复用;实现本体模型的增量变更机制,包括变更影响分析和局部重生成;开发针对特定行业(如企业服务、制造、金融)的预置本体模板库;开放 API 和 SDK,支持第三方工具和系统集成。
七、总结:一场软件范式的结构性转变
本文提出的"本体模型 + AI 大模型驱动的 AI 原生应用"范式,其本质是在试图弥合软件开发中长期存在的三个鸿沟:业务语义与代码实现之间的翻译鸿沟、传统 UI 操作与用户真实意图之间的表达鸿沟、以及静态软件架构与动态业务演进之间的适应鸿沟。
本体模型是这一范式的核心杠杆。它不是文档,而是可执行的语义规范;不是静态的需求说明,而是驱动代码生成和运行时执行的活的知识表示。当本体模型精确表达了业务的全部语义,AI 大模型就可以在两个层面发挥作用:在建造期将自然语言翻译成本体,将本体翻译成代码;在运行期将用户意图翻译成本体行为,将行为执行结果翻译成自然语言响应。
这不是"更好的低代码平台",也不是"带 AI 功能的传统应用"。它是一种以语义为核心基础设施的软件新形态——在这种形态下,业务专家和 AI 共同完成软件的定义,AI 和人类共同完成软件的运行。软件的边界,从此不再由菜单和表单划定,而由业务的语义本身划定。
热门跟贴