Advance China IP Law Office
The Author:
作 者:黄恕 华进专利事业群
承接上篇对人工智能模型“输入-处理-输出”全链路透明化撰写逻辑的解析,实务中仍存在“黑盒表述”“细节堆砌”“关联无据”等典型误区,导致说明书难以满足充分公开要求。本文为下篇,将聚焦上述高频问题,结合审查实践与典型案例,拆解撰写避坑要点,进一步厘清“充分公开”的实操标准,助力创新主体在新规下提升专利申请质量与授权稳定性。
一、常见误区与避坑提示
1
误区一:固守“黑盒”表述,核心逻辑模糊
典型案例
申请号202010440505.5的“一种支付操作的控制方法和系统”专利申请,因说明书公开不充分被复审委维持驳回。该案主张“基于脑波数据+商品信息+机器学习模型实现支付身份验证”,但存在三大核心缺陷:一是样本数据披露模糊,仅提及“若干用户的历史脑波数据”,未明确样本数量、采集参数(如脑波幅度、频率、采集窗口)及人群分层,导致本领域技术人员无法确认训练数据有效性;二是模型训练细节缺失,未记载采用的机器学习算法、训练参数(如优化器、学习率)及目标函数,仅泛称“通过样本数据训练模型”;三是输入输出关联无依据,既无身份识别准确率等实验数据,也未说明脑波信号与身份标识的特征映射逻辑,无法证明脑波、商品信息与身份验证的因果关系。最终合议组认定,本领域技术人员无法基于公开内容复现技术方案,不符合《专利法》第二十六条第三款。
新规调整方向:结合本案复审决定指出的缺陷,需针对脑波数据+购物习惯双模态训练场景,彻底打破“输入-输出”黑盒披露模式,实现训练方案、关联逻辑全透明,具体撰写建议如下:
一是精准披露样本数据细节,摒弃模糊表述,明确可落地的采集标准。针对复审指出的样本范围、脑波参数及场景特点不明问题,需明确三项核心信息:①样本数量与人群分层,如“采集200名18-60岁用户样本,按性别、年龄分层,每组样本量不低于30名,确保样本代表性”;②脑波数据采集参数,在取得用户授权前提下,明确采集环境、频率,提取特定波段的幅度峰值、频谱密度等核心指标,同步记录脑波信号稳定性参数;③购物习惯数据适配规则,采集用户授权后的历史购物核心特征,归一化为多维向量,保证与脑波数据的场景一致性。
二是细化模型训练全流程,明确架构、参数及适配逻辑,将“设想”转化为具体方法。结合与技术人员沟通确认的技术细节,分两层披露以回应“训练方案仅为设想”的质疑:①模型核心架构,采用“脑波特征提取分支+购物习惯特征融合分支”双路CNN架构,通过注意力融合层整合双模态特征;②具体训练参数与步骤,如采用Adam优化器,初始学习率1e-3,迭代300轮,目标函数为交叉熵损失函数。同时结合足量实验数据推导技术效果,说明该架构及参数可精准捕捉脑波个体差异性与购物习惯唯一性,实现双模态协同赋能身份识别。
三是建立输入输出关联闭环,以技术原理示意与实验数据示例补充披露,佐证二者关联性。针对复审指出的“无关联原理及评估数据”问题,结合与技术人员的沟通结果,从“原理示意+数据示例”两方面示范完善路径:①技术关联原理示意:确认核心关联逻辑后,围绕双模态输入搭建特征与目标结果的关联框架。需分别阐明两类特征(一类对应用户行为状态、一类反映个体独特性)与目标的关联原因、技术原理/逻辑依据,基于历史数据构建映射关系,说明权重分配机制的具体方式及核心原理,实现输入与验证结果的强关联;②实验验证数据示例:可补充示意性数据,如采用一定量未参与训练的用户样本测试,说明身份识别准确率、误识率及较单一模态模型的性能提升,通过场景对比测试佐证场景一致性对结果的影响。上述披露方式核心是示范“如何补充关联依据”,实际撰写需基于经验证的真实技术原理与实验数据,确保本领域技术人员可验证输入输出因果关系、复现技术方案。
2
误区二:堆砌无关细节+核心要点简略,导致核心要素被掩盖
典型情形
并非单纯堆砌公知技术构成披露缺陷,而是公知内容过度展开、核心改进点一笔带过,才会导致公开不充分。具体表现为:一是过度铺陈PyTorch/TensorFlow基础代码、环境配置等公知技术;二是冗余罗列初始化偏置值、显存占用等与创新无关的参数;三是弱化核心逻辑,对注意力融合模块等关键改进模块仅一笔带过,未明确其结构、参数依据及与技术效果的因果关系。
新规调整方向:遵循新《专利审查指南》“不可或缺即公开”原则,聚焦核心要素结构化披露,区分撰写主次——创新点详细展开,公知结构简要带过,仅公开影响技术实现的核心参数,杜绝披露失衡。
以某大模型改进方案为例,其架构含输入层、多模态特征提取层、双模态注意力融合模块、输出层,仅双模态注意力融合模块为核心创新点,其余公知层仅简要介绍功能即可;该模块需详细披露层级架构、数据处理过程及与其他层的连接关系,确保可复现。
例如可详细记载:该模块嵌入特征提取层与输出层间,采用“特征对齐-权重分配-融合输出”三级架构;通过1×1卷积层将图像特征压缩至N维,与时序特征维度对齐;权重分配采用ABC自适应算法(注:此处ABC仅指代本提案中改进的算法,在实务中需详细披露算法过程、函数表达式及核心原理),动态赋予适配权重;最终加权求和完成融合,输出标准化特征向量。
整个说明书撰写需通过“架构图+分层说明”明确界定创新与公知边界,架构图标注各层归属(公知/创新),分层说明中对公知部分的输入层、提取层、输出层仅作功能概述,对创新部分的双模态注意力融合模块重点展开上述核心细节。同时强化因果关联,明确创新点与技术效果的直接关系,例如“该双模态注意力融合模块通过ABC自适应算法方式的动态权重分配,解决传统固定权重融合适配性差的问题,有效提升模型对复杂场景的特征捕捉能力,进而使整体任务准确率提升P%以上”,确保核心逻辑清晰、技术链路完整。
3
误区三:输入输出无关联,技术效果无依据
典型案例
以传统多模态医疗数据疾病预测类方案(如融合医疗影像、电子病历文本、基因检测数据预测慢性肾病)为例,此类申请因“输入输出无关联、技术效果无依据”不符合专利法第二十六条第三款规定的风险极高,核心缺陷具有极强普遍性,具体可细化为两点:
一是输入输出关联无依据,逻辑链路断裂。说明书常仅泛称“多模态数据可丰富特征维度,提升预测精度”,却未结合医学领域常识建立具体因果逻辑。既未说明医疗影像中肾脏形态特征、电子病历血肌酐指标、基因APOL1位点突变,分别与慢性肾病发病风险的对应关系;也未解释融合三类数据为何能突破单一数据局限,仅停留在“多模态更优”的表层表述,导致本领域技术人员无法理解“输入组合与输出结果”的必然关联。
二是技术效果缺乏支撑,表述空泛无说服力。仅笼统声称“预测准确率较现有技术显著提升”,无任何可落地的验证信息支撑。既未披露测试数据集规格(样本总量、病例分期、对照组占比),也无准确率、灵敏度等关键量化指标;同时缺失对比实验设计,未明确对比基准与评价方法,技术效果沦为主观断言,无法验证方案可行性。结合专利代理实践经验,此类专利申请文件在后续审查过程中极有可能被审查员明确指出:“说明书未清晰披露多模态输入与疾病预测结果的因果关联,无完整实验数据验证技术效果,不符合26.3规定”。
新规调整方向:针对上述缺陷,结合医疗AI领域特性,从“逻辑补全+效果实证”两方面强化披露,兼顾具体性与简洁性,避免过度展开:一是夯实关联逻辑。结合医学常识明确输入数据与预测目标的对应关系,补全逻辑链路。例如可简要披露肾脏皮质厚度、血肌酐指标、APOL1位点突变分别对应肾脏结构、功能、遗传风险维度,协同关联可全面指向慢性肾病发病风险,解决单一数据覆盖不全问题。二是补充效果验证基础。披露核心测试信息以支撑效果可信度,明确样本规格、量化指标及对比基准,并且提供具体的实验数据,确保技术效果可验证。
二、总结与展望
新《专利审查指南》的发布与实施,标志着人工智能模型专利审查正式迈入“破除黑盒披露、聚焦改进点充分公开”的新阶段。人工智能模型说明书的撰写,本质是在“充分公开”与“避免捐献”之间精准找到平衡——既要依托“输入-处理-输出”全链路闭环,清晰披露核心技术逻辑,切实满足《专利法》第二十六条第三款要求,契合促进科技进步的立法初衷与民事法律权利义务对等的核心原则;同时需严守披露边界,不逾越必要的公开范围,不披露未纳入权利要求保护的技术内容,规避核心创新无偿捐献的风险。作为专利代理师,需与技术人员深度协同,精准锁定基于大模型改进方案的核心创新点,深入拆解创新点的实现细节,协助创新主体精准适配新规导向,彻底摒弃“黑盒”模式的申请文件撰写方式,凭借清晰的逻辑架构、明确的技术关联、扎实的实验支撑,将人工智能模型的技术创新转化为稳定可靠的专利权保护。
黄恕,高级专利质控工程师、省骨干专利代理师,14年+专利代理实务经验。深耕软件、通信、人工智能、计算机网络等领域,精通新申请撰写、OA 答复、复审无效及专利挖掘布局等实务,擅长处理计算机、AI大模型、智能控制类软件专利案件,在大数据分析、自动驾驶、智能制造、智能电网等领域积累了丰富的专利实务经验,可提供高质量的知识产权服务。
往期案例
想了解更多IP内容,敬请关注:
热门跟贴