识别领域内重点技术研发方向,是企业技术创新活动中不可或缺的关键环节,不仅关乎资源优化配置和创新效率提升,而且是推动企业持续发展、实现技术突破的重要战略举措。面向市场(或用户)需求,选择从竞争者导向角度出发,构建企业技术研发方向识别模型。首先,利用文本挖掘技术对领域内相关专利文本进行SAO语义结构提取和专利权人提取,并以与技术相关的S或O概念层级实体为技术表征,构建企业—技术关联网络及企业合作网络;其次,将企业—技术关联矩阵进行Z-score标准化得到企业—技术评分矩阵,并将社团划分算法应用于企业合作网络,综合社团属性和企业相似性分值选取Top-k项企业所涉及的技术,形成候选技术列表;最后,构建技术增长性和技术适用性指标,对识别出的候选技术进行定量评估,并结合企业自身技术布局为其推荐适合的发展方向。实证研究部分,以默沙东公司(MERI-C)为例,进行技术研发方向识别研究,为企业精准高效开展技术创新活动提供科学的决策依据。

00

引言

随着新一轮科技革命和产业变革的蓬勃兴起,科技发展呈现出前所未有的突破性态势,各国都在加大技术创新力度,试图在云计算、生物医药、新能源、新材料等领域抢占科技发展制高点。然而,技术创新是一个连续且动态变化的过程,涵盖了从新思想产生,到研究、发展、试制、生产制造再到商业化的各个环节,其中的关系也并非简单的线性模式,而是复杂多维的相互作用。与此同时,创新具有风险性,科学新发现并不能天然适应国家战略需求与市场微观需求,也不能直接转化为技术创新成果。因此,作为技术创新活动的主体,企业应在前沿导向鼓励的探索型研究与市场导向鼓励的应用型研究之间建立起桥梁,切实提高科技成果转化效率与转化效果。

在学术界,有关市场导向与企业技术创新活动的关系一直饱受争议。Christensen和Bower认为,企业在市场导向下开展技术创新活动难以获得真正意义上的突破性发展。周飞等则认为,企业以市场为导向,为不断满足日益变化的市场(或用户)需求而开展技术研发活动,并在此基础上开发新产品,是保持其竞争优势的重要途径;同样,杜鹏和万后芬发现,市场导向与企业绩效水平呈显著的正相关关系,且市场导向型企业能够根据市场环境的变化作出及时有效的反应,这有助于企业实施差异化战略,提升企业的竞争实力。究其原因,Narver等、张婧和段艳玲认为,市场导向有其细分类型,即反应型市场导向(Responsive Market Orientation,RMO)和先动型市场导向(Proactive Market Orientation,PMO);而后者属于企业主动性行为,也是决定企业技术创新活动成功的关键。进一步地,景奉杰和曾宪伟研究指出,决定企业成败的关键往往不在于其推出新产品的速度,而在于企业能否及时准确地对技术发展方向作出正确的判断并采取行动。面对如何在市场导向下选择技术研发方向的问题,学者们将其概括为3个行为要素(市场需求、竞争者导向、跨部门间协调)和两个决策标准(长期性中心和盈利性目标)。

综上,学者们围绕此类问题已经取得了较为丰硕的成果,为本研究提供了重要的参考思路。但在现实世界中,市场环境瞬息万变,企业需要根据市场变化及时调整技术策略,以保证自身可持续的竞争优势。因此,如何帮助企业尽快明晰市场上不断变化的需求,为其寻求具有发展潜力的技术研发方向是一个亟待解决的问题。本研究尝试结合SAO语义挖掘、协同过滤算法、Louvain算法,构建企业技术研发方向识别模型,为企业高效开展技术创新活动提供全面细致的决策支持。

01

相关研究

面向市场需求识别技术研发方向属于技术机会识别问题,即市场导向型技术机会识别,相关研究主要包含两种类型。

(1)在宏观层面(领域需求)。

Tuarob和Tucker以及Christensen等认为,在线社区中的用户评论信息对于新产品开发或产品功能改进具有重要启示,并采用文本挖掘与机器学习相结合的方法,辨别了“Idea text”(含产品相关反馈)和“Non-idea text”(不含产品相关反馈)。Ardichvili等认为,技术机会识别应建立在充分感知市场需求与技术资源之间差距的基础上,重视未被完全利用的技术资源,进而挖掘与市场需求相匹配的新技术。吴菲菲等从网络平台中获取无人机领域的研发需求,进而针对目标企业在无人机领域内的专利进行二次检索,并采用LDA主题模型与主成分分析法确定目标企业的技术空白。Wang和Chen提出了一种结合向量空间模型、潜在语义分析与异常值检测算法的专利挖掘方法,通过将已识别的异常点映射到由效用层级与情景选择构成的二维空间中,以用户需求为中心识别技术机会。

(2)在微观层面。

国内外学者对用户需求进行了更为详细的划分。Qi等、赵宇晴等使用基于模糊理论的KANO模型对从在线评论中提取的用户需求进行分类,并进一步与情感分析法结合构建需求—满意度量化模型,从用户需求类型出发,确定产品研发和改进的优先级。王艳等采用结构主题模型(Structural Topic Model,STM)从在线评论中提取用户对相关产品的功能需求,进而以SAO短语对技术要素进行表征,并结合STM模型筛选能够满足产品功能需求且具有融合倾向的技术要素,将其作为潜在技术融合机会。吴红等考虑了技术的组合性与递归性,基于产品评论数据与专利数据,建立了用户需求—产品功能—技术(专利)间的映射关系,进而以IPC分类号为基础知识单元,采用Dijkstra最短路径算法挖掘潜在知识组合,识别融合市场需求与具有知识组合可行性的技术机会。吴一平等主要关注用户对产品的技术需求,在建立技术特征—产品技术属性关联矩阵的基础上,构建了用户需求与技术属性之间的关联关系;进一步地,通过对技术属性的多维度分析,深入探究用户需求随时间的动态变化过程,为企业精准迎合市场技术需求提供参考依据。柳林林等基于领域数据抽取因果三元组(如 <功率耦合,导致,动态性能差> ),构建包含因果知识的技术网络;然后,通过情感识别、需求词抽取等步骤,识别用户使用过程中的需求因素并进行匹配,以实现机会识别。

与此同时,冯立杰等将技术维系统创新方法引入面向用户需求的技术机会识别中,展开了系统化研究。具体而言,在分析低端市场用户需求与技术生命周期的基础上,以目标用户需求为导向,通过探索创新法则与创新维度的作用方式,构建目标领域的多维技术创新地图,形成了面向低端市场颠覆式创新的技术机会识别路径。刘鹏等面向用户需求,构建了“创新维度—技术(主题)—功效(主题)”三级语义知识库,通过创新维度—功效矩阵识别产品的宏观创新机会,通过创新子维—功效矩阵识别产品的中观创新机会,通过创新形态—功效矩阵识别产品的具象创新机会。

相关研究的总结与归纳如表1所示。

表1 市场导向型技术机会识别相关研究

02

技术研发方向识别模型

通过上述分析,本研究面向市场(或用户)需求,选择从竞争者导向角度出发识别企业技术研发方向的原因如下。

(1)理论层面。Daniel和Juan通过对西班牙451家公司进行实证研究发现,市场(用户)需求和竞争者导向均可以对企业技术创新活动产生显著的正向影响。(2)技术层面。单纯从满足市场(或用户)需求出发挖掘的技术有可能是一项尚未被解决的技术难题,或不适合应用于新产品的开发以及产品功能的改进。(3)公司战略层面。当某一市场(或用户)需求已被企业识别利用时,对于当前或未来的其他企业来说也并不是就没有利用的机会了。这种对需求的再利用,可能源于“企业战略—市场需求—市场环境”中任何变化导致的不匹配。因此,本研究以专利文献为研究数据,构建企业技术研发方向识别模型,具体包括企业—技术评分矩阵构建、企业最近邻选择、技术发展潜力评估等3个步骤。

2.1 企业—技术评分矩阵构建

考虑到专利文献数量及自然语言处理所需的时间和复杂度等多方面因素,选择由专利标题与摘要构成的中长文本作为数据源。在获取专利数据后,采用Sem Rep提取SAO结构,并以与技术相关的S或O概念层级实体为技术表征,构建专利与技术之间的关联关系,如表2所示。

进一步地,以专利号PN为连接纽带,构建企业(专利权人)与技术之间的关联关系,如表3所示。

对表3所示数据进行Z-score标准化处理,即将多组数据转化为无单位的Z-score分值,使得数据标准统一化,提高数据可比性。计算公式如下:

式(1)—(2)中:x为技术节点在不同企业专利文本中出现的频次;μ为平均数;σ为标准差;N为表征技术的概念实体个数。计算得到的Z-score值为企业对技术的评分矩阵,该矩阵包含m个企业的集合Company={C1,C2,⋯,Cm}和n个技术的集合Item={I1,I,⋯,In}。其中,矩阵的行表示企业,满足1≤i≤m;矩阵的列表示技术,满足1≤j≤n。企业Ci对技术Ij的评分可用Rij表示,即上文提到的Z-score值。

2.2 企业最近邻选择

最近邻选择包含3个部分:(1)将余弦相似性法应用于企业—技术评分矩阵,度量企业间的相似程度,进而得到相似性得分;(2)将社团划分算法(Louvain算法)应用于企业合作网络,得到企业社团聚类结果;(3)综合考量企业相似性得分与社团属性,选取交集中的Top-k项企业所涉及的技术,形成候选技术列表。基于上一步得到的企业与技术评分矩阵,企业C1、C2的相似性得分计算公式如下:

式(3)中:RC1i和RC2i表示企业C1、C2对技术i的评分;m为涉及的企业总数。由于专利申请与授权情况能够表征企业科技产出状况和技术研发水平,将社团划分算法应用于企业的合作网络,同样可助力挖掘出具有较高技术相似性的各类企业。图1为企业合作网络构建及企业社团划分结果示意图。

图1 企业合作网络构建及企业社团划分结果示意图

注:不同颜色代表不同的社团;Cij为企业合作强度,即企业出现在同一专利中的次数。

2.3 技术发展潜力评估

企业若想通过技术创新取得长期经济效益,就必须纵观全局,从技术所处发展阶段和发展潜力出发,充分利用竞争环境所提供的机会。因此,构建技术发展潜力评价指标对候选列表中的技术进行评估。

表2 专利与SAO结构的关联关系示例

表3 企业与技术之间的关联关系示例

2.3.1 技术增长性(Technology Growth,TG)

在Jones和Twiss的研究中,技术发展水平反映的是某一特定技术在各个时期(或时点上)所处的发展阶段和所表现的成熟度,可以通过技术生命周期分析、TRIZ技术成熟度等方法来测度。通常情况下,技术生命周期可被划分为4个阶段:第一阶段为技术萌芽阶段,表现为与该技术相关的专利申请数量较少;第二阶段为技术成长阶段,表现为技术方向基本明确,技术创新取得了一定进展,与该技术相关的专利申请数量持续快速增长;第三阶段为技术成熟阶段,此时技术相对成熟,与该技术相关的专利申请数量增长趋势变缓;第四阶段为技术衰退阶段,该阶段或是遇到难以逾越的技术障碍,或是某产业的发展使得该领域技术创新活动减少,与该技术相关的专利申请数量逐步下降。在4个阶段中,差异最明显的是相关专利申请数量增长率的变化。因此,借鉴统计学领域增长率的思想,构建技术增长性指标(Technology Growth,TG),对各年度技术增长率求算术平均值,并以此为标准来判断技术所处的发展阶段。计算公式如下:

式(4)中:T为研究时间段;Pa(t)为待识别技术a在子研究时间段t上的累积量。

2.3.2 技术适用性(Technology Applicability,TAP)

技术发展潜力在一定程度上体现了技术发展的可能性,即概率问题,反映了技术潜在的应用规模和前景。常用的测度方法包括专利组合分析法、专利技术空间分布分析法、专利技术/功效矩阵分析法等。基于此,采用技术适用性(Technology Applicability,TAP)指标,测度技术在不同领域中应用的广泛性,进而评估技术在未来的应用规模和前景。计算公式如下:

式(5)中:C为技术总量;Ca为与研究领域相关的技术数量;Kaj为技术a在不同子领域中出现的频次;J为子领域数量。

03

实证研究

3.1 数据采集

《2020全球癌症报告》最新统计数据显示,2020年全球新发癌症病例为1 930万例,全球癌症死亡病例为1 000万例。其中,结直肠癌新发病例为220万例,位列第3;死亡病例为94万例,位列第2。纵观世界恶性肿瘤流行病的趋势和中国城市癌症发病谱的变化,研究人员认为,在今后10年间,结直肠癌将成为威胁中国人民生命健康的主要瘤种,癌症防控已成为中国健康战略的重点。因此,当以“为企业寻求满足市场需求且同时具有发展前景的技术研发方向”为研究目的时,将“结直肠癌治疗”作为“需求”便具有合理性。具体来说,基于科睿唯安公司的Derwent Innovation专利平台进行检索,截止时间为2023年12月29日,共获取72 082条专利数据。

3.2 数据预处理

第一步,采用Sem Rep对上述72 082条专利数据的标题和摘要进行SAO结构提取,并保留1 543个与肠道肿瘤类疾病相关的技术概念实体作为后文分析的对象。第二步,提取专利权人。在德温特数据库中,专利权人代码的编码形式有4类:ABCD-C(标准公司和高校、研究机构),ABCD-N(非标准),ABCD-R(苏联的机构)和ABCD-I(个人)。本研究选取代码为ABCD-C(标准公司和高校、研究机构)的专利权人作为分析对象,最终获得标准专利权人1 826个,平均专利申请量为22.45件;非标准专利权人16 065个,平均专利申请量为5.47件。表4列出了排名前10位的标准专利权人。

表4 标准专利权人(前10位)

从表4中可以看出,总部坐落于美国的默沙东(默克)公司拥有的专利数量最多,共1 127件。紧随其后的是总部坐落于英国的阿斯利康制药有限公司和总部坐落于美国的百时美施贵宝公司,专利数量分别为843件和837件。同时,在专利数量排名前10位的专利权人中,有4家公司来自美国,从侧面证实了美国在此领域拥有较强的研发实力。

3.3 技术研发方向识别

3.3.1 目标企业—技术评分矩阵构建

以专利申请数量排名第一的默沙东公司(MERI-C)为例,进行企业技术研发方向识别。默沙东总部位于美国新泽西州肯尼沃斯市,经营范围包括处方药、疫苗、生物制品与动物保健品等。多年以来,默沙东始终走在研发前沿,持续推动癌症、心血管代谢疾病、阿兹海默病、传染病等疾病的预防和治疗工作。仅在2020年,默沙东研发投入就达到了136亿美元,属于典型的高水平创新型企业。按照前文所述步骤,以专利号PN为连接纽带,构建企业与技术之间的关联关系矩阵,并按照式(1)计算方式对数据进行Z-score标准化处理,得到企业—技术评分矩阵(见表5)。

表5 企业—技术评分矩阵示例

3.3.2 目标企业最近邻选择

首先,运用余弦相似性法计算各企业与默沙东公司(MERI-C)的相似性得分,具体情况见表6。

表6 默沙东公司与其他企业间相似性得分(前20位)

其次,在获取企业间相似性得分的基础上,将社团划分算法(Louvain算法)应用于企业合作网络(见图2)。与默沙东公司同在一个社团的企业共有35家,具体信息见表7。

图2 企业合作网络

注:不同颜色代表不同的社团。

表7 社团划分结果

结合表6和表7的结果可以看到,仅从相似性出发选择目标企业最近邻难以确定相似性得分阈值。阈值太高,筛选出的最近邻企业数量过少;阈值太低,筛选出的最近邻企业则不具备代表性。而结合社团划分结果,与默沙东公司同在一个社团的企业共有35家,且相似性排名均在前37名以内,提升了最近邻选择的效果。

最后,综合考量企业社团属性和企业相似性分值,选取相似性排名Top5且与默沙东公司同在一个社团的企业(GLAX-C、BRIM-C、NOVS-C、SCHE-C、PFIZ-C)所涉及的257项技术,形成候选技术列表。

3.3.3 目标企业技术研发方向识别

针对上述由257项技术组成的候选技术列表,计算各技术点的技术适用性(TAP)与技术增长性(TG),结合默沙东公司的技术发展水平,为默沙东公司推荐适合的技术研发方向。各技术点的技术适用性与技术增长性坐标图如图3所示。

图3 技术发展潜力二维坐标图

由图3(b)所示的结果发现,默沙东公司可将酪氨酸激酶抑制剂与BRAF抑制剂作为未来研发或合作研发的两大技术方向。

(1)酪氨酸激酶抑制剂(Protein-tyrosine Ki-nase Inhibitor)

查阅资料可知(1),2021年,Exelixis制药公司宣布与默克(MERI-C)和辉瑞(PFIZ-C)达成了一项临床试验合作及供应协议,在正在进行的1b期剂量递增研究STELLAR-001(之前称为“XL092-001”)中,增加3个新队列,以评估XL092联合抗程序性死亡配体-1(PD-L1)免疫检查点抑制剂“Bavencio”治疗晚期结直肠癌患者的安全性和耐受性。其中,XL092是Exelixis制药公司开发的新一代酪氨酸激酶抑制剂,而Bavencio则是新一代抗程序性死亡配体-1(PD-L1)肿瘤免疫疗法,由默克与辉瑞共同开发并实现商业化。

从技术自身角度出发,酪氨酸激酶抑制剂已由Exelixis制药公司开发,属于满足结直肠癌治疗需求(已知需求)的一种技术手段;同时,酪氨酸激酶抑制剂也有较强的技术增长性和技术适用性,具有良好的市场发展前景。从公司自身角度出发,默沙东公司在选择自主研发或合作研发酪氨酸激酶抑制剂时,可以与已拥有的肿瘤免疫疗法相结合,进而在治疗晚期结直肠癌患者时发挥更大的作用。

(2)BRAF抑制剂(BRAF Inhibitor)

查阅资料可知(2),2020年4月8日,美国FDA批准了BRAF抑制剂——康奈非尼(Encorafenib)与西妥昔单抗(Cetuximab),用以联合治疗转移性结直肠癌(CRC)患者。此次批准是基于BEACON CRC的实验结果:康奈非尼+西妥昔单抗联合治疗组患者的中位生存期(Median Survival Time)为8.4个月,而对照组(伊立替康+依瑞替康)为5.4个月(HR=0.52,95%CI:0.39~0.70;P<0.000 1);康奈非尼+西妥昔单抗联合治疗组患者的中位无进展生存期(PFS)为4.2个月,而对照组仅为1.5个月(HR=0.40,95%CI:0.31~0.52,P<0.000 1)。

从技术自身角度出发,BRAF抑制剂——康奈非尼(Encorafenib)已被辉瑞公司(PFIZ-C)开发,属于满足结直肠癌治疗需求(已知需求)的一种技术手段;同时,BRAF抑制剂也有着较强的技术增长性和技术适用性,具有良好的市场发展前景。从公司自身角度出发,默沙东公司在选择自主研发或合作研发BRAF抑制剂——康奈非尼(Encorafenib)时,可以与已拥有的西妥昔单抗(Cetuximab)相结合,进而在治疗转移性结直肠癌(CRC)患者时发挥更大的作用。

04

结论与展望

面向市场(或用户)需求,本研究选择从竞争者导向角度出发,构建企业技术研发方向识别模型。首先,利用文本挖掘技术对领域内相关专利文本进行SAO语义结构提取和专利权人提取,并以与技术相关的S或O概念层级实体为技术表征,构建企业—技术关联网络及企业合作网络。其次,将企业—技术关联矩阵进行Z-score标准化,得到企业—技术评分矩阵,并将社团划分算法应用于企业合作网络,综合社团属性和企业相似性分值,选取Top-k项企业所涉及的技术,形成候选技术列表。最后,构建技术增长性和技术适用性指标,对识别出的候选技术进行定量评估,并结合企业自身技术布局为其推荐适合的技术研发方向。

相较于已有文献,本研究首先从竞争者导向角度出发,考虑了“企业战略—市场需求—市场环境”变化所带来的不匹配问题,适用于对需求再利用的探索;其次,将协同过滤算法与社团划分算法相结合,提升了最近邻选择效果,弥补了以往研究方法仅考虑相似性的不足;最后,技术发展潜力评估指标(技术增长性与技术适用性)可对最近邻的候选技术进行定量评估,在为企业推荐满足市场需求的技术研发方向的同时,也关注了其发展潜力。

本研究仍存在不足之处。首先,在市场竞争中,中小型企业由于成本限制往往不倾向于采取申请专利的方式,而是选择利用商业机密来保护自身的技术创新成果。因此,本研究所提出的方法对中小型企业技术机会识别的指导性偏弱,更适用于技术实力较强的企业。其次,本研究采用了基于UMLS的Sem Rep提取工具以及美国USFDA橘皮书中的医药数据。尽管所提出的方法可移植应用于其他领域,但在具体操作过程中,对于特征技术词的筛选,需要具体领域具体分析。最后,在结果验证部分,仅选择默沙东公司作为目标企业,后续将继续扩大验证范围,以提升方法的适用性和准确度。

本文来源于《创新科技》杂志2024年第7期。张硕,北京工业大学经济与管理学院讲师;乔亚丽,清华大学公共管理学院博士后;李荣荣,中国石油大学(华东)经济管理学院副教授。文章观点不代表主办机构立场。

◆ ◆ ◆

编辑邮箱:sciencepie@126.com