Forpersonaluseonlyinstudyandresearch;mercialuse以H指数为基础的学者评价指标改进-人力资源以H指数为基础的学者评价指标改进 袁野北京理工大学管理与经济学院摘要:H指数自诞生以来,由于其卓越的评价能力受到广泛的应用,并被大量讨论。随之而来的许多基于H指数的衍生指数,弥补了H指数的很多缺点,但是仍然存在很大的不足。笔者以H指数评价思想为基础,结合R指数等的优点设计出了新的有更好区分度和灵敏度的Y指数。通过对论文被引次数的调整,解决了H指数只能评价学者的终身成就的问题,增强了新指数对欺骗性引用的过滤,使新的Y指数有了跨学科评价的能力。其中学科标准化模型、施引文献质量和文献半衰期等属于首次和H指数结合。关键词 :Y指数H指数改进跨学科评价施引文献评价H指数于2005年由加州大学的Hirsch提出,也称Hirsch指数,主要用于对科学家个人绩效的评价。H指数通过不同科学家的h值来评定其绩效,定义当一个学者至少发表了h篇引文数量不少于h的文章时其H指数值为h。H指数为学者的绩效评价提供了一个全新的角度,自诞生起就引起了学界广泛的讨论。H指数有着兼顾学者论文数量和质量、指标稳定、可以测定学者的终身绩效等优点。随着对其研究的深入,一系列H指数的衍生指数的诞生也对H指数的一些缺点加以补足。例如R指数的提出部分解决了H指数敏感度和区分度的问题。然而这些改进并没有解决跨学科评价问题,对于故意的欺骗性的引用过滤效果不佳。过于侧重终身绩效的考察,也很不利于新入行的科研人员的创新。下面本文将构建一个新的评价方法来解决以上问题。一、。灵敏度不高主要是因为,作者的H指数需要增加1不仅需要有一篇新的论文被引次数超过原来的H指数值,还需要原来计入H指数的有效论文每一篇至少增加1次引用,这使得H指数的提高越来越困难。而区分度不够的原因一部分是由其自身的底灵敏度引起的,还有一部分原因是由于文章发表数量的严重不均,只有少量发表的作者占到了总人数的绝大多数,这使得低H指数区域每一个值上“堆积”了太多的人。理论上H指数的缺点可以很好地被R指数补充,有着相同H指数值的评价对象,往往可以通过R指数值加以区分。同时由于R指数过于重视高质量论文的作用,它也很难脱离H指数单独使用。如果将一位科研人员所发论文按照被引次数降序排列可以得到如图形1。这样新构建的Y指数其整数部分为H指数的值,小数部分可以很好地刻画核心论文的质量,完美地将H指数和R指数的优点结合在了一起。然而如果我们仍然用各个学科论文原来的被引次数,其学科差异和被引次数中的水分将使我们的改进毫无意义。为了解决这些问题,我们需要在下文对论文的被引次数做出一系列的修正,使调整后的被引次数能够真实地刻画该论文在其领域的水准。,论文的质量由其被引次数直接表示。学者的论文被另外一篇论文引用,则该论文被引次数即增加1。然而在不同学科被引用一次的难度是不一样的,被优秀论文引用和被低质量论文引用甚至是故意制造的虚假引用之间的意义更是不同的。为了解决这个问题,首先我们是在考虑施引文献数量之外增加施引文献质量对原论文质量的影响。而对施引文献质量的考量方式我们可以借鉴原论文的评价方法,即施引文献的被引次数和被引质量,这样会出现无限循环的想象。在这里我们人为规定施引文献质量只由其被引用次数决定。其次在考虑被引用次数对施引文献质量的影响时我们再引入学科标准化方法,目的是排除学科间被引次数的区别。在过去大多数的学科被引次数标准化模型中,都是假设被引次数按照正态分布,并且以总被引的算术平均值作为学科内的期望被引次数。然而Seglen的研究表明在任何学科内其论文的被引次数都不符合正态分布的特征,而是普遍呈现出偏态分布。也就是说用平均被引次数来衡量研究绩效并不能代表被引次数的分布特征。Lundberg进一步发现对被引次数取自然对数后再进行标准化处理,其分布更接近正态分布。hi等研究发现不同学科的论文被引次数除以其学科期望被引次数后获得的分布曲线是一致的。笔者经过实证研究,发现样本更加符合指数型分布的特征。hi等研究表明学科内被引次数分布于学科期望被引次数的相关性,本文使用的标准化模型如下:其中为调整后的论文被引次数,为论文与论文排名相关的线性函数,为论文调整前原被引次数,为该论文学科内的平均被引次数。将以上学科论文被引次数标准化模型与考量论文施引文献质量的思想结合起来,得到如下论文质量考核模型:其中为论文考虑施引文献的质量以及不同学科间区别后调整的被引次数,n为该论文总施引文献数量,为第i篇施引文献的出版年的该领域篇均被引次数,为第i篇施引文献的被引次数。我们可以认为,经过如上调整后的值的
以H指数为基础的学者评价指标改进 来自淘豆网m.daumloan.com转载请标明出处.