情报研究

基于K-means聚类的期刊操控引用行为特征指标研究

  • 鞠秀芳 ,
  • 孙建军 ,
  • 郑彦宁 ,
  • 潘云涛
展开
  • 1. 南京大学中国社会科学研究评价中心;
    2. 南京大学信息管理学院;
    3. 中国科学技术信息研究所
鞠秀芳,南京大学中国社会科学研究评价中心副研究馆员,博士,E-mail:Jxf@nju.edu.cn;孙建军,南京大学信息管理学院教授,博士生导师;郑彦宁,中国科学技术信息研究所研究馆员;潘云涛,中国科学技术信息研究所研究员。

收稿日期: 2013-01-05

  修回日期: 2013-02-15

  网络出版日期: 2013-03-05

Indexes in Citation Characteristics of Journals Manipulating Based on K-means Clustering

  • Ju Xiufang ,
  • Sun Jianjun ,
  • Zheng Yanning ,
  • Pan Yuntao
Expand
  • 1. Chinese Social Sciences Research Evalution Center, Nanjing University, Nanjing 210093;
    2. School of Information Management, Nanjing University, Nanjing 210093;
    3. Institute of Scientific and Technical Information of China, Beijing 100038

Received date: 2013-01-05

  Revised date: 2013-02-15

  Online published: 2013-03-05

摘要

认为部分期刊为了追求被引排名,开始操纵期刊的引用。这样的行为影响了期刊引文数据的质量以及利用引文开展的科学研究的可靠性。提出引文年代集中度、自引率、被引密度和引用密度4个引文指标用于识别期刊是否存在操纵引用的行为,并采用数据挖掘中的K-means聚类方法检验指标的有效性,实验结果显示这些指标都达到了较好的识别效果。

本文引用格式

鞠秀芳 , 孙建军 , 郑彦宁 , 潘云涛 . 基于K-means聚类的期刊操控引用行为特征指标研究[J]. 图书情报工作, 2013 , 57(05) : 114 -119 . DOI: 10.7536/j.issn.0252-3116.2013.05.020

Abstract

To pursuit cited list, some journals manipulate paper citation. The abnormal citing behavior among journals results in the bad quality of citation data and heavily decreases the reliability of citation analysis on scientific research. This paper proposes four citation indexes of self-citing ratio, citing year concentration, cited concentration ratio and citing concentration ratio, to discriminate whether there exists citation manipulations in journals. Based on k-means clustering method, it verifies the validity of these new citations indexes. The experiment result proves their recognition effect.

参考文献

[1] Bornmann L, Daniel H D. What do citation counts measure? A review of studies on citing behavior [J]. Journal of Documentation, 2008,64(1):45-80.
[2] Krauss J. Journal self-citation rates in ecological sciences[J]. Scientometrics, 2007,73(1): 79-89.
[3] Falagas M E, Alexiou V G. The top-ten in journal impact factor manipulation[J]. Ethics in Science,2008, 56(4):223-226.
[4] Schreiber M. Self-citation corrections for the Hirsch index[J]. Europhysics Letters,2007,81(3):1-6.
[5] Wallner C. Ban impact factor manipulation[J]. Science, 2009, 323(5913):461.
[6] 赵文义.期刊影响因子的影响因素分析[J].科技与出版,2006(2):23-25.
[7] 郭建顺,张学东,李文红,等. 我国科技期刊的高自引率及其不合理自引的甄别[J].中国科技期刊研究,2010,21(4):455-458.
[8] 潘云涛,武夷山.自引、他引:说不尽的故事[J]. 科技导报, 2007,25(24):85.
[9] 王晓莉,叶良均,徐飞,等.SCI作为科研成果评价标准的局限性研究[J].自然辩证法研究,2001,17(11):41-47.
[10] 袁培国.从CSSCI引文年代分布看中国社会科学期刊影响因子的计算[J].大学图书馆学报,2009(5):59-60.
[11] 苏新宁,杨建林,邓三鸿,等. 数据挖掘理论与技术[M].北京:科学技术文献出版社,2003:138.
[12] Han Jiawei, Kamber M.数据挖掘概念与技术[M]2版.范明,孟小峰,译.北京:机械工业出版社,2006:3-23.
[13] Soman K P, Diwakar S,Ajay V.数据挖掘基础教程[M].范明,译.北京:机械工业出版社,2009:215-216.
[14] 蒋艳凰,赵强利. 机器学习方法[M]. 北京:机械工业出版社,2009:3-6.

文章导航

/