国家叙词库是一个包含三层结构的知识组织系统,自下而上依次为工具层、表现层和应用层。在详细描述国家叙词库的结构和元数据框架的基础上,从基础词库、概念库和范畴体系方面,论述国家叙词库的构建流程,并对其未来的维护与应用机制进行展望。
认为为了提高叙词表的实用性,在叙词表编制和应用中,需要充分发挥词频信息的重要参考价值。通过总结词频信息的利用方法,包括通过词频和专业偏向度确定专业核心概念、通过词频信息确定优选词属性以及通过词频信息为概念确定范畴号。探讨对词频高低的词汇属性、优选词的重要程度、词频生命周期变化和词频使用的局限性等问题。
从互联网中搜索同义词具有非常重要的理论意义和应用意义,但同时也存在一词多义情况下无法对不同词义的同义词进行区分的问题。针对这一问题,提出一种对互联网同义词搜索结果按照词义聚类的方法,该方法利用术语间的词义关系转化为图结构,实现词义自动聚类,无需人工干预和学科领域知识,能够达到较高的聚类准确性。
提出一种基于英汉术语语义推导和归并的术语自动分类方法。以英汉术语库为基本语料,通过语义传导和词形规范为英文术语自动推荐候选分类,进而采用投票机制对推荐结果进行遴选和归并。实验结果表明,本方法对英文术语自动分类的准确率较高,具有一定的应用价值。
从知识组织的角度介绍概念映射的重要性,分析概念映射方法的深度及研究情况。面向等同、等级和相关映射的类型特征,提出基于精确匹配可以继承的概念映射关系,并分析由于中英文词表异质异构而引起的映射关系矛盾情况,如由于代项或参项而引起的一个概念精确匹配到多个概念的问题、等级映射的深度及相关映射的选择等,并基于汉语用户的需要及编制规则提出相应的处理规则。
从"斯诺命题"中"两种文化"分裂的角度对国内图书馆学研究中技术与人文之间的争论进行阐释,提出跨学科研究是破解图书馆学研究中"斯诺命题"的有效方法,跨学科研究的主要路径包括:以面向学科和面向问题并行作为研究起点、以图书馆学基础理论作为跨学科研究的主线、以跨学科的"团队协作"作为图书馆学研究的组织形式、以专业教育与通识教育相结合作为图书馆学教育的方式、以"学术"而不是"学科"作为研究成果评价机制的基点。
商业化信息资源数据库已成为网络学术信息的主流载体,数据库商为了追求自身利益的最大化,往往通过"资源独占"、"捆绑销售"、"技术控制"、"政策优势"等方法增强自身的垄断地位,阻碍了知识的有效传播,损害了知识受众和著作者的权益。采取"开放存取"、"买断服务"及"资助开放出版"等知识信息获取方式能够缓解当前存在的问题;数据库朝向更专业化的细分业务方向转型发展是一种必然趋势;从国家层面完善知识产权保护法和反垄断法是解决问题的长效机制。
目前,定题服务合同内容普遍以格式条款进行表述,但存在着合同条款分散、条款内容不全面且不具体、权利义务不明确、部分条款内容对委托方不公平,合同履行缺乏有效协作,合同履行过程中有侵权行为等问题。故此,应明确定题服务合同属于技术服务合同,并应准确把握定题服务合同主体特定性、公益性、非营利性、持续性、格式性合同等特征,完善格式合同条款内容,严格遵守定题服务合同的履行原则。
科技信息资源是国家的重要战略资源,如何有效地整合与共享各类科技信息资源,已成为当前科技信息资源建设工作的重点。通过对当前科技信息共享服务的现状进行分析,指出现存平台存在的问题并提出构建科技信息共享云服务机制,介绍该机制的整体状况及竞争性抢答系统、行业特色库和专题定制库三个特色系统,归结出科技信息共享云服务机制的特点,最后对未来的发展进行思考与展望。
将网络口碑传播的各要素(口碑信息、口碑发送者、口碑接收者、口碑传播平台和人际关系网络结构)与品牌发展阶段(品牌过往表现、品牌当前形象和品牌未来传播能力)相结合,设计出基于网络口碑的品牌评价体系(品牌发展趋势指标、品牌总体形象指标和品牌关注者口碑网络指标),并以天涯论坛中的国产奶粉品牌口碑为例进行实证研究,以期为当前网络环境中品牌评价和舆论监管工作提供理论框架和可借鉴实例。
针对国家自然科学基金中的面上项目建立一套指标,从资助的项目数量、资助金额、项目立项以来的论文产出以及项目均金额、项目均论文产出、论文均金额等几个方面对基金进行分析,并将文献计量学中的H指数和G指数引入到基金的评价体系中。利用该指标体系,建立一个对于基金项目的可视化分析系统,对于各个指标生成一个时间序列图,分析各指标的趋势。对项目立项以来论文产出以及项目均论文产出分别利用K-S检验和正态分布的曲线拟合,认为两者在显著性0.70的水平上符合正态分布,分析得出两者各自达到最大值的年份,发现项目均论文产出比项目立项以来的论文产出提前达到最大值。
随着Internet的发展,互联网上的学术文献数量呈指数增长,很难为科研工作者所利用,因此亟需一种方法对海量的网络学术文献进行自动的搜集、整理、分类。在前期充分的实验论证后,设计实现一个海量网络学术文献自动分类系统,该系统使用模块化设计,包括学术文献自动抓取模块、学术文献词-文档矩阵处理模块、本体集成模块以及基于语义驱动的分类模块。实验证明,该系统可以有效地完成海量学术文献的自动抓取、处理和分类工作。
从关联数据的链接机制入手,探讨采用关联数据技术构建知识链接的优势、构建模式和具体构建方法;根据知识链接的不同功能,将基于关联数据的知识链接划分为三种类型:等同链接、相关性链接、词汇性链接;最后从应用角度建立基于关联数据的知识链接的4层应用框架,包括描述层、链接层、整合层、应用层,同时展望基于关联数据的知识链接的应用。
利用云计算技术、语义服务技术来解决数字图书馆的资源重复建设问题和互操作问题,提出云计算环境下的数字图书馆语义服务的框架模型并给出解决方案。自行设计、建立数字图书馆云计算服务平台,并在云平台上进行服务部署。设计云计算环境下的语义服务的描述、部署和组合方式,提出基于硬件检测和语义的云服务调度模式。提出数字图书馆云节点的监控和可视化显示方案,设计数字图书馆云门户。
采用MetaStudio和DataScraper对网络源非结构化数据按照需要进行自动抽取和XML结构化,并自主开发Rdfizer软件包,将XML数据转换为RDF数据,进而基于自行扩展的Sesame框架构建关联数据发布平台,实现关联数据的存储、发布、查询、整合和推理等功能。
图书馆联盟的研究在国内已经开展将近30年,涌现出不少有价值的研究成果,也对图书馆联盟实践具有良好的指导作用。我国图书馆联盟研究的核心内容主要是图书馆联盟的基础理论、共建共享、不同类型的联盟、国外联盟介绍及比较、联盟建设与管理等。我国图书馆联盟需要借鉴国外图书馆联盟的成功经验,实现如下转变:从简单的采购合作到协力应对出版商、从资源获取到资源集成与知识发现、从资源服务到知识服务、从单一模式到多元化模式、从松散管理到积极有效的管理。