过刊目录

  • 全选
    |
    目录
  • 目录
    2024, 68(13): 0-0.
    PDF全文 ( )   可视化   收藏
  • 专题:数字人文研究
  • 专题:数字人文研究
    邓君, 滕玥
    PDF全文 ( )   可视化   收藏
    [目的/意义] 数字人文作为一个新兴领域在学术界方兴未艾,分析数字人文领域中的学科交叉与主题偏好,能够全面认识和诠释数字人文,有助于数字人文的可持续健康发展。 [方法/过程] 从学科与主题两大基线出发,基于国际学术界数字人文领域相关文献,采用网络科学的方法对数字人文领域中的学科交叉状况进行分析,掌握该领域学科交叉的基本状况,采用 BERTopic 主题模型对该领域中的研究主题进行识别,获得该领域的主题分布及基本偏好。在此基础上,将学科维度与主题维度结合,对数字人文领域进行跨维度的挖掘与分析。 [结果/结论] 研究结果表明,数字人文领域既包括数字技术类学科与人文类学科的学科交叉,也包括各人文类学科彼此之间的交叉融合。数字人文领域的研究并非泛在的中心化,而是具有鲜明的核心主题。不同学科自身的特征影响其研究主题的偏好,学科之间的交叉互补开拓了人文学科研究的新视野。本研究不但从学科与主题的视角更深层次地认识和诠释数字人文这一新兴领域,对于促进数字人文研究有序健康发展以及国家文化数字化战略有效实施具有积极的意义。
  • 专题:数字人文研究
    王丽华, 骆雨辰
    PDF全文 ( )   可视化   收藏
    [背景/意义] 数字人文凭借其强大的包容度和典型的跨学科性质,近年来呈现出蓬勃发展的态势,国内外数字人文会议层出不穷, ADHO 数字人文年会是其中最具盛名的,从时间维度对参与其中的会议论文做整体分析可以窥得数字人文发展的整体态势。 [方法/过程] 以 ADHO 数字人文年会为研究对象,在分析历届会议主题和各国学者参与会议情况的基础上,以 2013—2023 年会议论文为研究样本,综合运用词频分析、共词分析、聚类分析和社会网络分析方法,从会议论文关键词共现和时序变化情况发掘近十年国际数字人文领域的主题热点和演化趋势。 [结果/结论] 研究发现近十年数字人文领域的 5 个主要热点主题,具体包括知识挖掘与分析、LAM 机构间合作、文本编码标注与语料库、知识表示与知识组织和可视化呈现。国际视阈下的数字人文研究呈现出关联、开放与融合的特征,新旧知识相互联系,学科领域交叉融合,技术赋能特别是人工智能应用、LAM 合作向 GLAMS 迈进、中国特色文化资源挖掘将是未来数字人文发展的趋势。
  • 专题:数字人文研究
    靳庆文
    PDF全文 ( )   可视化   收藏
    [目的/意义] 数据驱动时代面临数据认知困难、解释结果晦涩难懂以及模型决策可信度不足等诸多挑战。融合可解释性结果的数据故事化方法,为应对上述挑战、增强数据利用价值提供理论支撑和解决方案。 [方法/过程] 梳理模型无关局部可解释性技术的解释形式、数据故事的叙事结构以及目前数据故事化研究中采用的方法,基于可解释性理论与数据故事化实现模式构建“析出—重组—叙事”的数据故事化模型,利用定义的要素元组给出数据故事映射流程,明确实现故事化模型设计的关键技术。 [结果/结论] 在数据故事化模型设计的理论指导下,提出面向解释结果的“扇形”故事化实现路径和融合解释结果与故事化模型要素的交互框架,并通过案例研究验证数据故事化方法在结果解释方面的实用价值。通过构建基于可解释性结果的数据故事化方法体系框架,为扩展具备数据感知与认知、可辅助智能决策功能的故事化路径提供新思路。
  • 专题:数字人文研究
    孙智中
    PDF全文 ( )   可视化   收藏
    [目的/意义] 数据故事涉及数据的利用、呈现和传播过程,能够激发受众行动,是数据时代实现数据价值的重要手段。但目前学界和业界对数据故事质量的认识仍较为表面化和主观化,缺乏理论支撑和客观测度,不能很好地回答什么是“好的”数据故事这一基本问题。据此现状,构建评价的理论模型和定量的评价体系,可丰富数据故事的理论知识,为实践活动提供诊断和改进工具。 [方法/过程] 以叙事学理论为基础,提出基于数据、故事和洞见 3 个核心维度的评价模型,并使用数学公式刻画评价模型的 3 种类型和 7 种子类型,为评价体系的构建提供理论支撑。立足于定量和可操作性原则,提出包含 9 个度量指标的评价体系,并通过实证研究验证其信效度。 [结果/结论] 研究结果表明,构建的评价体系可信并有效;高质量的数据故事应具备数据准确、包含必要细节、数据源规范等特征;评价体系和作品所对应的评价模型类型可用于作品的诊断和改进。
  • 专题:数字人文研究
    邓君, 钟楚依, 吕佳, 王奕铧
    PDF全文 ( )   可视化   收藏
    [目的/意义] 立足数字人文视域,对《徐霞客游记》游踪信息和情感信息进行可视化展示和细粒度剖析,在验证文学、历史学等领域相关研究结论基础上,为学者们后续研究《徐霞客游记》提供助力参考。 [方法/过程] 藉由 QGIS 工具和 GPT-3 模型,通过数据采集、清洗、统计、分析,以可视化方式展现《徐霞客游记》游踪信息和情感信息,挖掘游记文本背后的深层信息。 [结果/结论] 直观展现《徐霞客游记》的游踪及情感信息的时空分布,将数据思维引入《徐霞客游记》的内容挖掘中,丰富游记体裁研究范式。
  • 理论研究
  • 理论研究
    郭亚军, 冯思倩, 寇旭颍, 刘振阳
    PDF全文 ( )   可视化   收藏
    [目的/意义] 探讨生成式 AI 背景下的图书馆员角色定位,提出图书馆员职业技能体系,助推图书馆智慧化发展。 [方法/过程] 基于相关研究文献,利用可视化工具 VOSviewer 构建关键词共现网络图谱,梳理专业生成内容(PGC)、用户生成内容(UGC)、人工智能生成内容(AIGC)技术更迭下图书馆员的演进历程,探索其未来角色定位、职业技能与发展进路。 [结果/结论] 生成式 AI 背景下,图书馆员的未来角色定位为数据与信息的质检员、知识的导航员、智慧的传播者,应构建基于批判性思维的认知技能、基于行动者网络的共创技能与基于信息生命周期管理的职业技能体系。
  • 理论研究
    秦春秀, 马茜茜, 马续补, 时莹
    PDF全文 ( )   可视化   收藏
    [目的/意义] 场景在新一轮科技革命和产业变革中的作用日益凸显,同时也为信息资源管理领域的研究与实践提供了新的认知视角。本文系统探究场景的内涵、特征并构建场景分析模型,以期为场景驱动的信息资源管理服务的相关研究提供参考框架。 [方法/过程] 使用文献分析法剖析信息资源管理视角下的场景概念,分析信息资源管理视角下场景的特点和应用价值,在此基础上,构建信息资源管理视角下的场景分析模型。 [结果/结论] 信息资源管理视角下的场景在服务主体、研究对象、空间和研究目标方面具有明显的领域特征,并在提高要素整合能力、提升行业服务能力方面具有重要的应用价值。构建的场景分析模型由空间、时间、技术设备、信息资源、用户五大核心要素构成,关注场景与信息资源管理各环节工作的交互过程,可为场景驱动的信息资源管理与服务研究提供参考框架。
  • 工作研究
  • 工作研究
    陈添源, 胡婧
    PDF全文 ( )   可视化   收藏
    [目的/意义] 构建数据驱动的用户留存分析框架,赋能区域高校图书馆联盟提升馆藏资源共建共享效益和用户增长,开拓精准化文献信息服务新途径。 [方法/过程] 以福建省高校数字图书馆文献信息服务为实证对象,融合同期群阶段划分构建用户留存实证分析框架,以业务战略和服务场景为依托自上而下重构联盟高校图书馆的群体用户画像标签体系,继而采集全量用户行为数据描绘文献信息服务的共建共享效益、用户留存特征及其资源需求差异,最后依据次月留存期、选择留存期和平稳留存期等阶段探讨与之相适宜的用户服务策略。 [结果/结论] 实证结果表明:文献传递时效是用户留存的核心效益指标,开拓用户成长体系、提升用户粘性、沉淀用户储值成本和拓展服务功能势在必行。对处于不同用户留存阶段的用户群体,可以根据服务场景的业务度量指标制定差异化的精准服务策略。
  • 工作研究
    闫亚飞, 贾苹, 杨雨寒, 钱力, 吴振新, 孔贝贝, 顾玲琍, 魏喜武, 马岚, 黄岑
    PDF全文 ( )   可视化   收藏
    [目的/意义] 数字科技资源长期保存是国家科技自主创新能力的重要保证和国家科技安全的重要体现。我国的科技创新机构拥有大量的数字科技资源,类型多样,学科范围广泛。深入了解科技创新机构的长期保存需求,推进长期保存工作在更多科技创新机构中开展,将有助于推进我国数字科技资源长期保存工作的开展。 [方法/过程] 对北京、上海、深圳三地 135 家机构的数字科技资源现状、长期保存现状及需求、长期保存合作需求等信息进行问卷调研和专家访谈,并对调研结果进行分析总结。 [结果/结论] 目前,我国科研机构所拥有的数字科技资源类型及呈现方式差异化较大,多数机构已经意识到数字科技资源长期保存工作的重要性,并愿意在国家政策的推动下,与外单位在技术、管理规范、标准体系和设备等方面开展合作。基于调研结果,建议国家层面成立长期保存工作联盟,增强科技创新机构的长期保存意识;加强机构层面的数字科技资源管理工作,机构、学会和联盟层面联合推动实现数字科技资源的分级分类及有组织开展保存工作;遴选特定领域,与国外数字保存先进机构或者组织开展合作;建立我国数字科技资源长期保存认证体系;拓展面向更广泛领域的数字科技资源长期保存工作。
  • 情报研究
  • 情报研究
    祝琳琳, 李贺, 刘嘉宇, 田泽金, 武贺顺
    PDF全文 ( )   可视化   收藏
    [目的/意义] 研究旨在厘清社交媒体信息影响力形成因素之间的层次关系与关联路径,为社交媒体信息影响力研究提供理论与实践支持。 [方法/过程] 基于社会认知理论,从行为、认知、环境 3 个方面提取 14 个形成因素,通过解释结构模型分析形成因素之间的相互影响关系,构建形成因素层级系统,运用交叉影响矩阵相乘方法分析形成因素的依赖性和驱动力,确定因素之间的强度关系。 [结果/结论] 信息接收者情感共鸣、信息接收者价值认同以及信息发布者的知名度属于根源层因素并处于独立集群;信息传播者转发行为等因素均间接影响社交媒体信息影响力的形成且属于自发集群;信息质量等因素可以直接影响社交媒体信息影响力的形成且处于依赖集群。
  • 情报研究
    李洁, 张国标, 周毅, 郗玉娟, 杨金庆
    PDF全文 ( )   可视化   收藏
    [目的/意义] 为实现科技文献推荐场景要素的交互增强,将各要素交互特性捕捉问题转化为多任务共同优化学习问题,构建基于动态多任务学习的科技文献推荐模型,以进一步提升科技文献推荐性能。 [方法/过程] 采用多任务学习方法,针对科技文献推荐要素可采集的关键特征进行子任务解构,借助多头注意力机制,进行子任务交互关系的动态学习,在动态学习各任务交互关系的基础上设计科技文献推荐模型。 [结果/结论] 根据CiteULike 数据实验结果,所构建的 DMRSTL 模型在 3 个评价指标上均显著优于对比模型,最高差值为 AUC指标提升 15.51%, MRR 指标提升 11.90%, nDCG@5 指标提升 16.45%,且通过任务组合对比实验进一步表明,借助推荐要素的交互增强,可以有效提升科技文献的推荐性能。
  • 知识组织
  • 知识组织
    赵志枭, 胡蝶, 刘畅, 沈思, 王东波
    PDF全文 ( )   可视化   收藏
    [目的/意义] 以人文社科领域为出发点,从人文社科领域基础知识与人文社科学术文本两个方面入手进行人文社科领域模型性能比对。旨在为人文社科领域提供一份体系化的大模型评测基准,供人文社科相关领域研究人员参考。 [方法/过程] 设计 7 个人文社科领域相关的评测任务并选取对应指标,在此基础上,选取当前开源且性能较优的通用领域中文大模型,通过调用本地模型以问答形式完成领域化任务,并选取相关指标对其在人文社科领域的性能进行量化评测。 [结果/结论] 评测结果表明,在选取的开源模型中,无论是基座模型还是对话模型, Qwen 性能最优、 Baichuan2 紧随其后、 InternLM 次之、 Atom 表现最差,此外,大多数情况下,相较于基座模型,对话模型表现出更加优越的性能。
  • 知识组织
    吴树芳, 杨强, 朱杰
    PDF全文 ( )   可视化   收藏
    [目的/意义] 网络敏感信息发现对于净化网络空间和维护社会稳定具有重要意义。针对当前网络敏感信息发现研究忽略长距离上下文语义,从而导致发现性能欠佳的问题,提出敏感词融合权重惩罚 BiGRU 模型的网络敏感信息发现方法。 [方法/过程] 首先,得到敏感词的统计权重、类别权重和情感权重,并将三者融合得到敏感词的融合权重;其次,利用融合权重构建敏感词加权损失函数,以惩罚 BiGRU 模型对包含敏感词文本的错误发现;最后,基于惩罚后的 BiGRU 模型实现对网络敏感信息的发现。 [结果/结论] 在新浪微博真实数据集上的实证结果显示,与已有方法相比,提出的方法在精确率、召回率和 F1 值上均有一定提高。
  • 简讯
  • 简讯
    2024, 68(13): 154-155.
    PDF全文 ( )   可视化   收藏