知识组织
孔玲, 胡昊天, 张卫, 王东波, 叶文豪, 白如江, 王效岳
[ 目的 / 意义 ] 科学术语承载学科基础知识与核心概念,对跨学科知识扩散的学术全文本引文中科学术语进行知识挖掘与特征计算,对深入探究跨学科的知识体系交叉融合规律与影响力具有重要意义。 [ 方法 / 过程 ] 以情报学为例,在无标注跨学科语料下,基于获取的权威科学术语知识体系,借助字序列标注模型与远程监督算法获取跨学科知识扩散科学术语抽取与分类的学习语料,进而探讨基于深度学习的最优模型,从知识发现角度定义新科学术语判别规则,最后进行科学术语跨学科知识扩散的学科分布、引用章节位置、概念专指度等多维特征计算。[ 结果 / 结论 ]RoBERTa 模型在各项指标上整体表现最优,其调和平均值达到 98.08%,说明该算法能够保证跨学科知识扩散科学术语识别的可靠性和有效性。基于远程监督与深度学习的科学术语识别方法有利于挖掘跨学科知识扩散科学术语知识,可为跨学科知识扩散的智能知识挖掘提供领域化的基础计算资源支撑。多维特征计算能有效探究跨学科知识扩散科学术语交叉融合规律。