数字图书馆知识组织系统的构建有赖于本体的开发与完善,从解决数字图书馆知识组织系统语义丰富度视角,对当前学界对该领域热点问题的研究状况进行分析,包括:本体构建与复用,本体整合、语义分析与抽取、语义标注以及语义互联应用。
数字图书馆知识组织语义互联是一个复杂的过程,在这一过程中主体、客体和环境等诸多因素直接或间接地影响其实现。主体包括数字图书馆知识组织者和数字图书馆用户;客体主要是语义互联对象、语义模型、技术与标准;环境主要是宏观环境、中观环境和微观环境。主体通过对客体进行的一系列活动,影响和控制着语义互联的表现结果、发展与变化;环境通过作用于主体影响和控制着语义互联的进展。所以,正确识别其影响因素就显得尤为重要。
基于语义网格技术,探索基于元数据本体的数字图书馆系统间的互操作策略,以期用来解决目前数字图书馆系统间互操作所面临的问题,即不同本体之间的互操作,跨语言、跨文化的互操作,数字图书馆的发现与安全性等,并提出下一代数字图书馆系统间互操作框架。
简述语义模型是实现数字资源语义关系形式化描述的方式,是数字图书馆知识组织语义互联的重要影响因素。作为数字图书馆知识组织语义互联的重要环节,信息抽取需要本体提供语义知识依据,同时产生的文档也可以作为设计和丰富本体的知识资源。构建数字图书馆知识组织语义互联的语义模型以“元数据、领域本体、桥本体、本体解析体系”为核心要素,在此基础上探讨信息抽取的策略。
根据OWLS本体框架,基于OWLS的三类本体ServiceProfile、ServiceMode、ServiceGrounding来探讨基于OWLS的数字图书馆服务映射、服务发现及服务组合,提出数字图书馆服务发现的思路与模型。在此基础上,提出数字图书馆的服务组合流程并对其进行例证。
在对现有数字图书馆检索结果的组织方法进行分析的基础上,从忠实于用户提问的角度,提出基于领域本体的检索结果动态组织方法。基本解决思路是将文献的标识与用户的提问进行有效地对接,即以用户提问为基础构造提问模型,并基于检索结果构造标识模型,将提问模型与标识模型在语义层面通过领域本体进行映射,从而实现文献标识与用户提问在语义层面的互通,最终以用户提问的语义方式来展现检索结果。
目前中国的公共信息公开主要注重于满足公众的信息需求,较少从公共信息供给的角度分析公共信息公开问题。偏重公共信息需求,缺少考虑公共信息供给会造成供给缺乏激励,供给方式不合理等问题。通过对公共信息供给的市场情况分析,讨论竞争和垄断条件下公共信息供给的均衡结果,演绎公共信息供给的理论模型,提出公共信息供给的管理策略。
结合web2.0的特点,在对专长进行深入研究的基础上,以复杂性建模思想以及知识管理的基本理论为指导,设计一种新的专长识别与共享实现方法——自适应专长识别与共享模型(AEISM),该方法能克服传统方法中的部分缺陷,并解决新环境中所遇到的新问题,因此具有一定的实用价值。
分析Lucene的语言分析器结构,针对其只能进行中文单字、双字切分的不足,采用基于词典的正向最大匹配分词算法,设计并实现基于Lucene的中英文语言分析器ZH_CNAnalyzer,实验结果表明其能够对中英文文档进行高效索引,满足实际应用的需要。