针对术语的集成、共享与服务问题,以知识组织理论为基础,提出一种自底向上的层次型术语服务体系结构模型,通过数据层、管理层、服务层三个层次实现术语的集成服务以及知识组织与术语服务的紧密对接。对网络环境下术语服务基本机制、功能模块和相关技术进行分析,并构建术语服务系统的基本原型,初步证实术语服务体系的可行性。
通过概念的形成过程、概念的表达形式,论述基于概念的术语服务形式;同时,基于叙词表的等级关系与相关关系,论述如何通过概念关系组织相关术语,实现基于叙词表概念关系的术语服务方式;最后,讨论术语服务的知识产权、更新维护及映射集成问题。
指出术语集成是一项以计算机为交流媒介、对各种知识组织体系的术语资源进行语义映射融合和集中控制管理的应用研究。通过对国内外术语集成与服务的相关研究现状的调研分析,提出基于知识元和MARTIF的术语集成方法,包括面向规范性和应用性的术语集成基本原则,以词汇属性描述、词间关系组织和相关知识链接为描述结构的术语集成描述框架以及应用于数据交换过程中的机器可读术语交换格式(MARTIF)。
叙词表国际标准在修订过程中,新增大量与基于知识组织的术语服务相关的内容。通过对这些标准技术内容的深入剖析,结合基于知识组织的术语服务现状,探讨叙词表的最新修订对基于知识组织的术语服务未来发展的影响。这些影响体现为三个方面:推动基于知识组织的术语服务的规范化发展,促进术语集在基于知识组织的术语服务中的应用,促进基于知识组织的术语服务与术语工作的协调发展。
以英文同义术语为例,提出三种有效的自动获取互联网术语资源的技术手段,包括语法模式的自学习,在线同义词典的抽取,静态同义术语分类的爬取。在此基础上,设计并实现互联网同义术语检索原型系统(Web Synonym Searcher)。实验测试表明,从互联网中自动获取同义术语是一种非常有前景的途径。
针对学科与机构评价活动常见的被评价机构层级划分问题,提出一种基于黄金分割法的三层级划分方法。该方法有深厚的理论依据,与大多数评价者选择的层级数量相符,且具体计算与操作过程简单方便。对ESI的4个学科的评价实践表明,该方法可以很方便地对降序排列的被评价机构划分层级,并且三个层级之间的各项指标值呈现一定的比例关系。在总被引次数方面,排序从高到低的三个层级之间大体为2∶1∶1的关系。
高影响力作者是一个科研机构科研产出的主要力量,因此对作者的机构分布规律的研究是进行科研机构评价的主要内容之一。以ESI(Essential Science Indicators)的学科分类和机构与作者排名算法为参考,以Web of Science的基础数据作为数据源,通过对作者和科研机构之间关系的深入分析发现,在研究所涉及的4个学科中,总体上80%左右的高影响力作者就职于总被引排名前1%的机构。基于机构分层的作者分布分析结果显示,三个层次的高被引机构所拥有的高影响力作者的比例均维持在比较稳定的水平。在此基础上,提出以机构拥有的高影响力作者的比例为指标的新的机构评价方法。
按ESI的学科分类标准,从SCIE下载ESI农业科学所有期刊2008年至2011年所发表的全部论文的原始数据,再利用软件对原始数据中的同名作者和同名机构进行识别与归并,消除数据不准确带来的误差。然后,根据ESI进入前1%的作者与机构具有高影响力的划分原则,对农业学科的高影响力作者和机构进行统计,重点分析农业领域高影响力作者的学术卓越性、学术生产力和学术影响力,并对高影响力机构进行分层评价。最后,利用共词分析法对所有论文的主题分布进行统计分析。
为全面评价植物与动物学的基本研究和发展状况,从SCI下载ESI植物与动物学科所有期刊2008年至2011年所发表的全部论文的题录,统计分析其中高影响力作者、高影响力机构以及研究主题的发展变化。为消除作者和机构名不准确带来的误差,首先利用软件对题录数据中的同名作者和同名机构进行识别与归并。重点分析植物与动物学高影响力作者的学术卓越性、学术生产力和学术影响力,并对高影响力机构进行分层评价。主题分析采用共词分析和可视化分析等方法,对论文的关键词进行聚类,并以可视化手段展示植物与动物学的核心研究内容、热点及不同研究内容之间的关联。
以2006-2010年物理学、化学、医学或生物学三个学科门类诺贝尔奖获者得突出贡献文献(参比论文)和与其研究领域密切相关的论文(非参比论文)为研究对象,在原有研究基础上结合统计学分析结果,从12个与论文学术影响力密切相关或一般相关的计量指标中最终筛选出7项组成综合评价体系,利用主成分分析法计算每篇论文的综合评价值(以下简称"F值")。结果表明,综合评价指标体系及其所获F值在总体上相对他引量可以更好地表征高学术影响力论文的品质,并且在一定程度上"纠正"仅以他引量对不同科学门类论文评价时出现的系统偏倚,具有在跨科学门类论文评价、比较上的可应用性。
人工智能是当代工程科技前沿研究中的学科领域之一,也是国家科技发展规划的重点领域和优先主题。以EI Compendex数据库收录的国际人工智能领域权威学术会议AAAI2002-2011年的会议论文为研究对象,运用科学计量学方法和可视化技术,绘制当代国际人工智能领域的知识图谱,对包括国别、机构和作者在内的研究力量分布以及热点、前沿和所涉学科在内的主题内容进行分析和总结。此外,通过对知识图谱的深度解读,发现科学计量及可视化方法在探析学科领域研究主题时,既需改进自身的方法工具,也应与内容分析及作者行文模式等研究相结合。
以演化博弈理论为基础,界定网络信息生态链概念,认为网络信息生态链是在一定的网络信息环境下,信息人之间通过不断博弈形成信息流转的链式依存关系。阐述网络信息生态链的演化博弈特性,根据信息主体支配能力差异将网络信息生态链分为弱势网络信息生态链、半强势网络信息生态链和强势网络信息生态链,并以淘宝网为例,剖析半强势网络信息生态链博弈关系,为深入分析网络信息生态链演进规律提供依据。
阐述作者关键词耦合和形式概念分析的基本原理,详细讨论在作者关键词耦合的基础上生成概念格的具体方法以及知识结构的建构过程。通过对该方法在某一科研组织中的应用举例,阐明该方法能够较好地揭示组织知识结构。与传统的共词分析方法相比,基于形式概念分析的作者关键词耦合分析方法层次化效果更清晰、人工干预程度更低。
针对文献计量系统的共性,回顾文献计量工作的发展历程,阐述文献和学术实体之间的关系,提出文献-实体关系模型。作为文献计量系统的通用模型,文献-实体关系模型能对文献数据的文本进行智能处理,实现半结构化纯文本文献数据向结构化关系数据库格式的完整转换,为文献计量系统的研发奠定基础。
详细介绍kene概念的来源,对国外学者关于kene的研究进行梳理,在此基础上,提出kene对基于知识的技术演化具有显著正向影响的假设,运用339份调查问卷进行结构方程的实证研究。实证分析结果表明假设成立,kene是技术演化中的重要知识结构,是技术演化的关键内部要素。