知识组织
吴梦成, 林立涛, 齐月, 黄水清, 王东波, 刘浏
[目的/意义] 挖掘和组织先秦典籍中的植物知识,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义。 [方法/过程] 对先秦典籍中植物词进行详尽标注与计量分析;基于条件随机场( CRF)和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计面向知识图谱的古汉语植物知识组织模式。 [结果/结论] 基于古汉语预训练语言模型 SikuRoBERTa 构建的古汉语植物命名实体识别模型性能最优,调和平均值达 85.44%,为基于实体的植物知识挖掘提供了有效方法;所构建的先秦典籍植物知识图谱可实现对先秦典籍中植物实体及其关联知识的聚合与可视化呈现。