过刊目录

  • 全选
    |
    目录
  • 目录
    2023, 67(9): 0-0.
    PDF全文 ( )   可视化   收藏
  • 专题:多元数据融合视角的新兴主题探测
  • 专题:多元数据融合视角的新兴主题探测
    丁敬达
    2023, 67(9): 3-3.
    PDF全文 ( )   可视化   收藏
  • 专题:多元数据融合视角的新兴主题探测
    张梦芸, 丁敬达
    PDF全文 ( )   可视化   收藏
    [目的/意义] 信息技术的快速发展使得用户评论、患者症状等短文本数据量迅速增长,如何从短文本中挖掘有价值的信息成为文本分类的研究热点。[方法/过程] 以国内某医院各科室患者的病情症状数据为语料集,针对短症状文本包含语义信息不足的问题,从各科室症状词的重要度与关联度出发,将症状文本中低于设定症状词数量的文本作为语义增强对象,采用Word2Vec与基于概率的TF-IDF算法抽取各科室的若干典型症状关键词,将其补充到语义增强对象中形成新语料集,最后利用机器学习算法对症状文本进行分类。[结果/结论] 基于文章语义增强方法构造的新语料集,相较于原始语料集,在支持向量机(Support Vector Machine,SVM)、多项式朴素贝叶斯(Multinomial Naive Bayes,MNB)以及随机森林(Random Forest,RF)上的分类效果均有较大幅度提升,准确率分别提高约10%、9%、10%。
  • 专题:多元数据融合视角的新兴主题探测
    丁敬达, 钟建兰
    PDF全文 ( )   可视化   收藏
    [目的/意义] 通过对国内外近10年新兴主题属性量化的研究成果进行梳理,为新兴主题探测方法的改进提供参考与借鉴。[方法/过程] 在梳理新兴主题相关概念的基础上,通过文本内容分析归纳新兴主题的主要属性,从单一属性量化、多属性融合量化2个方面综述目前的研究进展。[结果/结论] 目前的研究主要基于文献外部特征对新兴主题的新颖性、增长性、关注度、影响力、连贯性和持续性等属性进行量化,多属性融合的量化方法包括赋权法、交点法、复杂融合法和回归法等。但现有的量化方法仍存在不足,未来需要基于多元数据来提高属性量化的全面性和准确性、探索新兴主题其他属性的量化方法、提高属性量化结果阈值设置的科学性、加强对新兴主题属性的重要性和各属性之间相关性的研究并进一步拓宽新兴主题属性量化方法所选用的领域范围。
  • 专题:多元数据融合视角的新兴主题探测
    张家惠, 丁敬达
    PDF全文 ( )   可视化   收藏
    [目的/意义] 大科学时代,海量且类型多样的学术文献给新兴主题的识别和把握带来一定的困难和障碍。因此,基于多源数据,新兴主题探测方法的研究就十分必要和有意义。[方法/过程] 对期刊论文、学位论文、会议文献、基金项目等多种来源数据,利用PLDA模型分别进行文本语义内容挖掘,结合VSM模型将多源数据在主题语义层面进行深度融合,并根据新兴主题特征量化指标进行筛选和识别。[结果/结论] 实证研究表明将文本内容挖掘和文献计量测度相结合进行文化遗产领域新兴主题探测方法可行;同时分析该领域新兴主题的数据源分布情况,发现其最初多以会议文献和基金项目形式呈现,期刊论文、学位论文具有一定滞后性。
  • 理论研究
  • 理论研究
    马海云, 薛翔
    PDF全文 ( )   可视化   收藏
    [目的/意义] 针对目前智慧健康知识服务的发展面临的数据利用率低、个性化知识服务不完善、公众关注度低等诸多困境,引入服务生态系统理论,旨在探索一种良性、可持续的智慧健康知识服务方式。[方法/过程] 首先,在把握智慧健康知识服务生态系统内涵的基础上,厘清智慧健康知识服务生态系统的主要参与者、价值创造模式及外部制度因素等关键要素,构建面向智慧健康的知识服务生态系统。然后,为保障后续理论发展与应用落实,从平台建设优化、用户激励培训、数据管护开放、政府保障、社会参与等多个方面对可能面临的痛点和难点进行系统梳理并提出相应建议。[结果/结论] 提出并构建面向智慧健康的知识服务生态系统,尝试突破现阶段将知识服务平台作为“价值创造者”和用户作为“价值享用者”的思维定势,旨在通过各方的协作,实现资源整合与价值共创,化解目前智慧健康领域知识服务各方资源之间的隔阂,充分调动各方力量的互补与合作,实现智慧健康知识服务过程中形成互利共生的局面。
  • 理论研究
    潘银蓉, 刘晓娟, 张容旭
    PDF全文 ( )   可视化   收藏
    [目的/意义] 数据交易是数据要素市场化配置改革的关键和难点,当前我国数据交易面临诸多问题,亟需破局走出困境。引入生态系统的理论视角,有助于从整体协调的角度认清数据交易的发展制约因素,进而提出可行之策。[方法/过程] 采用比较类推法,通过分析数据交易与生态系统的相似性来论证数据交易生态系统的可行性,进而明确该生态系统的运行机制与特点。以此为基点,通过访谈法和网络调研法,发现数据交易现实中还存在数据要素权属复杂、交易双方彼此博弈、第三方机构缺失及监管缺位等制约因素。[结果/结论] 为充分释放数据交易潜力,需为克服这些制约因素制定路径策略,通过长期、系统、动态、可控的治理实现生态系统的动态演进与稳定平衡。
  • 理论研究
    张莉曼, 张向先, 孙绍丹
    PDF全文 ( )   可视化   收藏
    [目的/意义] 政民互动数据对完善社会治理有重要价值。立足于分布式认知视角,将交互叙事思想应用到政民互动数据分析方面,为高效传递政民互动数据价值提供新的视角和研究思路。[方法/过程] 借鉴心理学的分布式认知理论与故事工程学的交互叙事思想,运用跨学科研究法解析政民互动数据交互叙事的认知主体、认知客体与认知环境。在此基础上,从认知客体角度提出政民互动数据交互叙事模式,从认知环境角度探究政民互动数据交互叙事的实现路径。[结果/结论] 相较于传统的静态叙事,交互叙事的灵活性更强,而分布式认知理论为政民互动数据交互叙事的实现提供系统性的理论框架,对发挥政民互动数据的决策赋能价值有重要的指导意义。
  • 理论研究
    宋丽萍, 刁文芳, 石雅芳, 韩昕媛
    PDF全文 ( )   可视化   收藏
    [目的/意义] 分析开放科学环境下科研人员的负责任评价(RRA)新取向,以期为“破四唯”指导下的我国科研评价实践提供借鉴与参考。[方法/过程] 以传统评价体系“唯与责”的背离为切入点,以全球研究理事会(GRC)《2021年RRA报告》、欧盟《研究评价系统改革报告》等典型内容文本为数据源,采用WordSmith提取关键词及词丛,并进行可视化。[结果/结论] 分析认为,基于同行评议定性判断与负责任计量相结合的方法,对于多种研究产出、活动的质量与贡献认定成为开放科学环境下科研人员RRA的基本框架与准则,其中,小同行评议与分类评价成为破除“唯论文”、SCI至上等不良学术驱动因素的核心规则和必由之路;元评价则为提高科研人员评价质量、优化指标与方法提供了循证依据。研究指出:此框架将利于纠偏基于产出的价值观,促进早期职业生涯科研人员(ECR)职业道路的差异化与多元化以及研究生态系统功能的最大化,推动包容、健康的研究创新体系的建立,同时为我国科研人员评价改革提供了有益的启示。
  • 工作研究
  • 工作研究
    李洪晨, 张志强
    PDF全文 ( )   可视化   收藏
    [目的/意义] 《“十四五”公共文化服务体系建设规划》《出版业“十四五”发展规划》都要求广泛开展全民阅读活动。本研究通过ARIMA模型对全国国民阅读调查结果进行预测,从而为实现“十四五”期间公共文化服务体系建设规划提供参考。[方法/过程] 以图书阅读率、纸质图书人均阅读量、报纸人均阅读量和阅读率、期刊人均阅读量和阅读率、数字化阅读接触率、电子书人均阅读量、国民综合阅读率作为被观测数据,对未来国民的阅读接触率和阅读量进行预测。[结果/结论] 研究发现纸质阅读人均阅读量、图书阅读率、电子书人均阅读量、数字化阅读接触将继续保持增长状态,其中图书阅读率2022年或将超过60%。期刊阅读率将继续下降,但是期刊人均阅读量在2022年可能出现近年来的首次增长。期刊产业应把握这一机遇,加强主题出版和学术出版建设。报纸阅读率和报纸人均阅读量仍将持续减少。
  • 工作研究
    王文韬, 宋天骁, 钱鹏博, 谢阳群
    PDF全文 ( )   可视化   收藏
    [目的/意义] 根据用户体验地图的研究思路,提取用户体验信息、追踪用户体验变化,对高校图书馆开放应用服务全过程进行优化,为实现高校图书馆信息系统服务与智慧校园的开放融合提供有益参考。[方法/过程] 通过引入用户体验地图,以可视化的方式展现用户在应用高校图书馆信息系统开放服务中的行为变化、主观想法和情绪状态,纵贯式测度用户在整个过程中的综合体验。[结果/结论] 根据所绘制的高校图书馆开放应用服务用户体验地图,准确定位用户在体验中的痛点,从多个维度提供有效策略,助推智慧校园平台下高校图书馆信息系统开放融合研究的创新和发展。
  • 工作研究
    高凡, 徐思佳
    PDF全文 ( )   可视化   收藏
    [目的/意义] 近年来,政府数据开放已成为我国数字化发展战略顶层设计的重要组成部分,探究政府数据开放中数据安全的影响因素有利于提升政府数据安全治理能力。[方法/过程] 依据技术-组织-环境(TOE)框架与已有文献研究,初步构建政府数据开放中数据安全影响因素模型,并基于广东省21个地市级政府案例,运用csQCA定性比较分析法进行实证研究。[结果/结论] 经济水平、法律政策和技术保障是构成数据安全的充分条件;推动数据开放安全建设存在四条组合路径,即技术驱动型、环境主导型、压力驱动型和全面驱动型;在特定客观条件下,组织维度中的法律政策和领导重视条件发挥着2-3个条件组合的协同作用。
  • 情报研究
  • 情报研究
    唐璐, 刘昊, 陈云伟, 张娟
    PDF全文 ( )   可视化   收藏
    [目的/意义] 对科技决策咨询建议报告的撰写方法进行研究,以期在国际科技竞争加剧及国内科技自立自强建设的背景下,助力科技情报工作有效发挥科技决策咨询的重要作用。[方法/过程] 以科技情报机构产出的决策咨询建议报告为研究对象,归纳其主要特征、厘清其基本类型,并基于国际标准化组织(ISO)制定的战略情报管理标准与模型提出适用于科技决策咨询工作与决策咨询建议报告撰写流程的DDIKI循环模型,运用该模型探讨这一类产品的撰写策略与方法。[结果/结论] 科技决策咨询建议具有战略性、精准性、可读性、启示性四大特征,可分为即时情报推送、案例剖析推介、发展态势研判、科技问题分析、风险预测预警等五大类别,基于DDIKI循环模型可划分为输入需求、搭建框架、收集与分析数据、解析信息、提出建议、输出报告等六大流程环节,可为科技情报机构开展决策咨询工作、撰写决策咨询建议报告提供流程、方法、策略等参考,以期服务于新时期科技情报机构强化使命定位、助力高水平科技智库建设、应用于科技决策咨询服务工作、为高水平科技自立自强提供战略性支撑。
  • 情报研究
    王露荷, 吕沨绚, 虞逸飞, 张琳, 黄颖
    PDF全文 ( )   可视化   收藏
    [目的/意义] 全文引文分析以施引文献的全文数据为研究对象,从引文在施引文献中的引用位置、引用语境、引用情感和引用强度等方面揭示引文特征,可以从语句层面和语篇层面加深对引用内涵的理解,进而更好地辅助科学评价。[方法/过程] 基于Web of Science核心合集中新近提供的被引参考文献深度分析功能数据,以2021年出版且拥有被引参考文献深度分析模块的1 582篇图书情报领域论文数据作为研究样本,批量获取全文引用的相关图表信息和相对应的文献著录信息。借助文本分析与可视化工具从引用位置、引用语境、引用强度3个方面分析引文特征。在此基础上,引入学科交叉测度指标,分别测度不同文献章节位置和功能模块上的交叉程度,从而揭示目标文献的学科交叉特征。[结果/结论]Web of Science提供的被引参考文献深度分析功能为实现大规模全文本引文分析提供了重要数据基础,但当前版本还存在拥有被引参考文献深度分析模块的论文覆盖率低、引用情感分类模糊、引用动机缺少明确规范等问题。图书情报是一个注重跨学科交叉、多学科融合的领域,通过探究图书情报领域论文的引文特征,进而基于全文引文信息深入挖掘学科交叉特征,对于增强公众对图书情报学科的理解与认知有重要价值。
  • 情报研究
    王文娜, 许正良, 李贺, 谷莹, 刘金承
    PDF全文 ( )   可视化   收藏
    [目的/意义] 在主题挖掘的基础上融入典型城市差异分析视角,帮助共享住宿平台因地制宜地改善用户体验、提高用户粘性,从而推动典型城市平台用户管理精细化、科学化,实现平台的可持续发展。[方法/过程] 以小猪短租平台为例,爬取北京、上海、成都、广州和三亚5座典型城市的15 040条在线评论,通过LDA主题模型提取用户关注主题,基于Stacking集成学习算法和IPA分析工具从重要性和绩效两个维度分析用户对不同城市主题的关注度与满意度差异。[结果/结论] 结果发现,用户住宿体验过程中关注主题主要包括人员服务、周边交通、基础设施、感官认知、经济价值、风景建筑、主题特色和餐饮体验8类;同时,结论进一步明确了各城市处于优势区、劣势区、改进区和保持区的主题差异性,实现对用户关注主题的跨城市分析。研究为主题挖掘学术研究提供新的研究思路,也为共享住宿平台有效配置资源提供实践指导。
  • 知识组织
  • 知识组织
    李雪思, 张智雄, 刘熠, 王宇飞
    PDF全文 ( )   可视化   收藏
    [目的/意义] 科技文献是记录科学问题提出和求解过程的重要载体,其中的研究问题句对于揭示科学问题具体内容、把握文章的研究主题具有重要作用。自动识别科技文献研究问题句是科技文本挖掘中一个重要的任务。[方法/过程]针对研究问题句自动识别,首先提出一种基于迭代的半自动标注策略,结合模型预判的置信度进行人工校对,对研究问题句数据进行标注。在此基础上,采用BERT-CNN的架构设计句子分类模型,该模型引入BERT生成文本向量,并使用CNN提取文本特征,然后通过实验与基准模型进行对比验证了模型的有效性。[结果/结论]基于提出的标注策略构建了大规模规范可用的数据集,经过人工检验准确率达到95%;并在此基础上设计了基于BERT-CNN架构的识别模型,在研究问题句识别任务中F1值达到94.8%。本文的研究为科技文献研究问题的挖掘与分析提供了高质量的数据支持和有效的模型方法。
  • 综述述评
  • 综述述评
    王丹丹, 刘亚宁
    PDF全文 ( )   可视化   收藏
    [目的/意义] 对国内外科学数据价值相关研究进行梳理,总结研究现状,展望未来方向。[方法/过程] 采用文献调研法广泛获取科学数据价值相关文献,采用网站调研法分析国外重要机构的研究及项目成果,对科学数据价值相关研究进行回顾与展望。[结果/结论] 目前科学数据价值研究主要集中在科学数据价值内涵、科学数据价值影响因素和科学数据价值评估3大主题上,整体研究仍处于起步阶段。未来应从科学数据价值及其实现的基础理论、科学数据价值影响因素内容和机理、科学数据经济和社会价值测度3个方面来深化研究,从完善科学数据分类分级政策标准、加强科学数据安全流通和有效监管、培养科学数据主体数据管理能力、构建科学数据价值实现良好生态4个方面来推进实践。
  • 简讯
  • 简讯
    2023, 67(9): 31-31.
    PDF全文 ( )   可视化   收藏
  • 简讯
    2023, 67(9): 52-52.
    PDF全文 ( )   可视化   收藏
  • 简讯
    2023, 67(9): 62-62.
    PDF全文 ( )   可视化   收藏
  • 简讯
    2023, 67(9): 150-150.
    PDF全文 ( )   可视化   收藏
  • 简讯
    2023, 67(9): 151-152.
    PDF全文 ( )   可视化   收藏