学术研究

《上海交通大学学报》穆蕴秋、江晓原:SCI和影响因子:学术评估与商业运作——Nature实证研究之三

载《上海交通大学学报》23卷5期(2015)

 

SCI和影响因子:学术评估与商业运作

——Nature实证研究之三 

穆蕴秋 江晓原

(上海交通大学,科学史与科学文化研究院,200240)

 

 

摘 要:SCI论文(引用)及期刊“影响因子”,被当今学界视为最权威的学术评估手段,却严重忽视了这两者纯粹的商业性质。本文集中考察三个方面内容:SCI论文(引用)和期刊“影响因子”的历史形成过程;上述两者规则设计的合理性质疑;揭示两者背后的商业化运作机制及学术包装手法。

 

关键词:SCI(科学引用索引);JCR(期刊引证报告);影响因子;尤金·加菲尔德

 

一、科技信息的商业价值

二、SCI和JCR的历史起源

三、SCI推广之诺奖预测

四、学界对SCI的争议

五、对“影响因子”两项准则合理性的质疑

六、为商业机构打造高端学术形象

七、“黄金俱乐部”的准入门槛

 

英国《自然》杂志(Nature)创刊于1869年,如今已成科学神话。它在中国科学界更是高居神坛,据2006年《自然》杂志上题为“现金行赏,发表奖励”的文章中说,当年中国科学院对一篇《自然》杂志上的文章给出的奖金是25万人民币,而中国农业大学的类似奖赏高达30万人民币以上,这样的“赏格”让《自然》杂志都感到有点受宠若惊。[[1]]

 

《自然》之所以被学界捧上“神坛”,主要的原因,是它在风靡全球的“刊物影响因子(impact factor)”游戏中,长期以来遥遥领先于世界上绝大部分科学杂志——2014年,它的影响因子高达41.5,在SCI期刊中位居第七。换言之,对《自然》的迷信,很大程度上就是对SCI和期刊“影响因子”的迷信。

 

但奇怪的是,与这种“迷信”形成鲜明对照,学界对SCI和期刊“影响因子”的历史形成过程,了解却十分有限,而且几乎完全没有注意到这两者纯粹的商业性质。当前的研究,仍然集中在把SCI和期刊“影响因子”当成理所当然的权威学术评估手段,用于衡量个人、学术团体、研究单位、甚至一个国家的整体学术水平。另一方面,由于对相应历史缺乏必要的了解,即使对“游戏规则”的合理性有所质疑,也难以形成深入的看法。

本论文将从科学史研究视角出发,结合SCI和期刊“影响因子”的历史形成过程,从源头上对其规则设计的合理性进行深入考察,并揭示这两种学术评估手段背后的商业化运作过程,这是前人未曾涉及的工作。

 

一、科技信息的商业价值

 

科学情报研究所(Institute for Scientific Information,以下按通行习惯简称ISI)逐年发布的科学引用索引(Science Citation Index,简称SCI)和期刊引证报告(Journal Citation Report,简称JCR),被当今科学界视为两种最权威的学术评估数据。许多人误以为它们是由“科学界权威机构”发布的——尽管实际上这家“科学情报研究所”从一开始就是一家地地道道的商业公司,1992年又被汤森路透(Thomson Reuters)收购。只是ISI的这一性质,多年来一直不太为普通公众和许多学界人士所知。

 

行用半个多世纪以来,两种数据已经彻底改变了科学界的学术生态和发表机制。创立者尤金·加菲尔德(Eugene Garfield,1925~),个人经历显得中规中矩,没有任何“出格”之处。他1925年出生于纽约布朗克斯区,1949、1954年先后从哥伦比亚大学获化学学士学位和图书情报学硕士学位,1961年获宾夕法尼亚大学结构语言学博士学位。

 

1956年,在职攻读博士的加菲尔德注册成立一家名为DocuMation的小公司,推出的第一款信息产品——目录快讯(Current Contents,简称CC),是一种对管理类杂志目录进行定期汇编的小册子。除了零售散卖,贝尔实验室(Bell Lab)成为他第一家企业用户。加菲尔德后来回忆,为了完成与贝尔签订的500份订单,需要先投入500美元作为印刷经费,他靠从私人银行贷款才勉强度过难关。[[2]]

 

加菲尔德的事业转折发生在1960年。这年他将公司正式定名“科学情报研究所”,此前曾一度改名“尤金·加菲尔德学会(Eugene Garfield Institute)”,与美国国家健康学会(The National Institute)合作,获得国家科学基金(NSF)30万美元政府资助,共同承担建设基因文献引用索引库(Genetics Citation Index)项目。

 

项目对1961年28个国家出版的613家期刊20000本杂志上的140万条参考文献,建立引用索引,进行编目,最终结果共得五卷,其中基因类文献的引用索引独立成一卷。1963年,基因引用索引数据库顺利结项,加菲尔德原本期望国家科学基金能进一步提供资助,将余下四卷一起出版,但后继申请计划被拒。加菲尔德决定独立承担出版事宜,并将其统一命名为科学引用索引(Science Citation Index),即学界现今所熟知的SCI。

 

二、SCI和JCR的历史起源

 

SCI收录一定范围数量的期刊——这通常也被称为“源刊(source journals)”,通过在源刊文本和源刊参考文献之间建立“引用索引(Citation Index)”,可提供检索学者的SCI论文发表数量和被引用次数——在理工科领域,对学者学术水平的评判现今主要取决于这类数据。

 

1964年,ISI首次出版1961年SCI报告,此后逐年出版,延续至今。ISI在1973、1978年相继推出的社会科学引用索引报告(Social Science Citation Index,简称SSCI)和艺术&人文科学引用索引报告(Arts & Humanities Citation Index,简称A&HCI),完全套用了SCI的产品思路和模式。

 

从方法上来说,SCI 采用的“引用索引”受到的是美国一种判例援引法律工具书的启发。美国法律遵照“判例”原则,法院进行判决时,必须与本院或上级法院此前对相似案例做出的判决保持一致。1873年,芝加哥一个叫弗兰克·谢帕德(Frank Shepard 1848~1902)的法律出版商,开始出版一种他自己编印的工具书,在判例和援引案例之间建立索引,统一进行编列,并标记判例是否已被推翻、撤销、修改或加入限制条件。这种工具书能帮助律师快速了解一个判例是否仍然适宜援引,出版后大受欢迎,法律人士几乎人手一本。谢帕德的名字甚至衍化成了一个法律术语“Shepardize”,意为“查阅《谢帕德引证》”。[[3]]

 

JCR,即“期刊引证报告”,本质上是SCI的衍生产品,它逐年发布的期刊影响因子(详见下文),是基于对SCI(后来包括SSCI和A&HCI)“引用索引”数据进行整合处理后得到的结果,该数据现今已成为学界评判期刊优劣的权威指标。[[4]] 1975年,JCR首次以SCI附卷的形式出版,1993年,它被独立推向市场。

 

作为一种期刊评估手段,JCR的思想源头可追溯至格罗斯(Gloss)夫妇1927年《科学》(Science)上的一篇文章。他们试图解决这样一个问题:在图书馆预算有限的情形下,应该参照什么标准为学生购买供查阅的化学期刊?[[5]]、[[6]]

 

最简便的方法,当然是找一个权威专家为图书馆开列一个目录清单,但这会受到专家本人阅读经验和个人好恶的左右,特别在购买范围较大的情形下,并不太适用。

 

格罗斯夫妇提出的解决方案是,选取知名刊物《美国化学学会杂志》(Journal of the  American Chemical Society),对它1926年发表的247篇文章的3633条参考文献进行统计,按引用次数对所有被引刊物进行排序,刊物重要性与排序结果直接对应,图书馆可参照此清单进行购买。这种筛选方式操作简便,且不存在太高专业“门槛”,很快被其他信息科学家借鉴推广到别的学科领域(参见表1先前学者的整理结果)。[[7]]

 

表1:SCI和JCR出现之前各学科筛选期刊的方式

 

作者(论文发表年份)

选取期刊数量

参考文献数

学科领域

Gross &Gross,1927

1

3633

化学

Allen,1929

9

2165

数学

McNeely & Crosno,1930

7

17991

电气工程

Gross & Woodford,1931

6

3574

地理

Gregory,1934

~40

26760

医学

Hooker,1935

5

12794

物理学

Hackh,1936

20

22575

牙科

Henkle,1938

1

17198

生物化学

Brown,1956

57

38000

多学科

Garfield,1961

613

约140万

所有科学学科

 
 

SCI作为JCR的数据基础,相较前人有所突破的地方在于,不再区分学科类别,收录期刊海量增加。

 

但这并不是它们之间根本的区别,根本区别在于,格罗斯夫妇及其后继者们采用同样的方案对期刊进行筛选时,还保持着非常“纯洁”的动机,为的是创造便利、服务学术。SCI和JCR却不是这样,它们从一出生就是商业信息产品,“赚钱”才是它们与生俱来的属性。

 

这种属性也是加菲尔德千方百计让它们位居高端,凌驾于学术之上的真正动力。其中力证SCI可以预测诺奖,对帮助实现这一目标,起到了关键作用。

 

三、SCI推广之诺奖预测

 

1965年,即SCI推向市场的次年,在美国海军研究办公室(Office for Naval Research)主办的一次学术会议上,加菲尔德和他的助手提交论文做了大会报告。[[8]] 当时ISI迫切需要打开SCI的市场,所以这次大会报告很大程度上也是一次不失时机的产品推介。加菲尔德的报告从五个方面阐释了SCI的功能:

 

1)便于学者了解前人工作,减少不必要的重复研究;2)作为评估研究成果的手段;3)便于追踪发表成果的来源和出处;4)可用于计算期刊的“影响因子”(参见本文第5节);5)为科学史研究提供一种有效的辅助手段。

 

在阐述第2项功能时,加菲尔德选择了最能撩拨学界敏感神经的“诺奖预测”来进行论证。他利用1964年首次出版的1961年度SCI报告比较了两组数据:

 

1)1961年共有257900位学者的成果被SCI论文引用,统计他们的引用情况;

 

2)1962、1963年共产生13位物理、化学和医学诺奖获得者,统计他们1961年度被SCI论文引用的情况。

 

从数据结果可看出(参见表2),13位学者在得诺奖的前一年,他们的成果被SCI论文引用的平均数量和次数远高于一般水平。这确实能说明,优秀科学家群体有着更高的SCI论文被引用数,但并不足以支撑加菲尔德的论断:SCI论文引用数可以反过来用于评估单个学者的学术水平。

 

事实上,就在两年前的一篇文章中,加菲尔德还主动发出警告,利用论文引用次数评估科学家和科学成果可能存在风险,理由是“论文的影响和论文的重要性及意义是两码事”。他甚至非常恰如其分地引用了苏联李森科(T. D. Lysenko,1898~1976)的例子,说如果引用次数最多的作者应该获得诺奖,那会得出李森科是苏联最伟大科学家的荒谬结论。[[9]]

 

其实13位诺奖获得者中,已经存在一个明显的反例。按照加菲尔德的统计,1963年度物理学诺奖获得者,约翰内斯·詹森(J. H. Jensen 1907~1973)1961年3篇论文的SCI引用才4次。如果单凭SCI论文引用次数来衡量詹森的成果,会得出一个荒谬的结论,这位诺奖得者的学术水平连平均线(5.51次)都没达到。

 

表2: 1961年两组SCI引用数据的对比结果

 

1961年SCI引用情况

人均被引论文

人均被引次数

论文平均被引次数

自引率

257900位学者

3.37篇

5.51次

1.57次

7.8%

13位1962-63 诺奖得主

58.10篇

169次

2.90次

10.5%

比较结果

17.24倍

30.67倍

1.84倍

 

 
 

但是,加菲尔德在随后持续打造SCI“产品形象”的过程中,却似乎完全忘记了当初发出的警告。从1965至1983年间,他先后撰写了30余篇文章,力图证明SCI论文引用可以“预测”诺奖。在1990年的一篇综述文章中,加菲尔德对这些文章的讨论结果进行了归纳(参见表3)。[[10]]

 

表3:1961-1990年六组SCI“高引作者”名单预测诺奖的结果

 

引用年份

1967

1972

1961-72

1961-75

1961-76

1965-78

截取年限

1

1

11

14

15

13

引用排名

前50

前50

前50

前249

前300

前1000

已获诺奖者

8

5

5

13

15

26

起止年份

1967-90

1972-90

1972-90

1975-90

1976-90

1978-90

后获诺奖者

6

7

13

38

22

35

获诺奖总人数

145

118

118

97

89

76

 

 

列表中的数据,以1967年为例,该年度论文被引用数排名前50的学者中,包括8位已获诺奖的人士,1967年至1990年共产生145位科学(物理、化学和医学)诺奖获得者,其中有6位出现在这个名单上。余下5组数据,包含了类似的信息。

 

这些结果中,SCI“高引名录”中已获诺奖的人数不能说明问题。因为一旦某位学者获得诺奖,立马会被当成首屈一指的“大权威”供奉起来,他的论文自然会受到更多关注,也就可能获得更多的SCI引用。

 

要检验引用是否可以预测诺奖,主要还得看“高引名录”未来究竟产生了多少诺奖获得者。从加菲尔德呈现的6组数据来看,“高引名录”获诺奖的概率确实比较大,两者存在“正相关关系”。如果把抽样年限加长、名单扩大,这种相关性还会得到加强。

 

不过,只要稍微深入探究一下,就会发现加菲尔德对数据的处理存在三个问题:

 

首先,非常明显的一个问题是,加菲尔德有对结果进行“选择性呈现”的重大嫌疑。我们知道,学界每年新增SCI论文数以万计,这些论文产生的引用会让SCI高引作者名单各年大不相同,而且截取年限不同,高引名单的结果也不一样。加菲尔德6组数据起始年份各不相同(最早为1961年),截止都在1990年(综述写于这一年),截取年限依次为1年、1年、11年、14年、13年和15年,并无章法可循。套用他的做法,如果把1961到1990年30年按所有可能截取的持续年限进行排列,会得到465种结果,对应排列出来的高引名单应该有465份——而加菲尔德仅仅给出了其中6份,呈样率仅为1.2%,他没有交代如此选择的任何理由(哪怕宣称是“随机抽取”)。

 

其次,没有说明“高引名单”人数的选取标准。通常情形下,名单越长,出现诺奖得主的概率也就越大。加菲尔德的6组数据,名单人数从最初的50扩大到了后来的1000,并没有给出任何解释理由。

 

再次,没有明确预测的有效年限。通常来讲,预测事件发生是有时限要求的。加菲尔德6组数据的预测年份截止于1990年,只是因为他的综述写于这一年,意味着“高引名单”的预测有效期限可能止于任何年份,也可能永久有效,这完全背离了“预测”的基本要求。

 

在加菲尔德之后,有学者采用相同路径加入“预测”行列,[[11]] 这些研究对引导学界相信SCI论文高引名单可成功预测诺奖,起到推波助澜的作用——实则是在自觉不自觉帮助SCI树立产品形象。

 

ISI 2014年最新公布的“高引名录(highly cited-2014)”,包括的科学人士多达3216位。尽管该名录2014诺奖命中为零,但这并不妨碍它继续受学界追捧。因为在“SCI引用”风行整个学界的年代,能进入“高引名录”已经被当成学术水平突出的象征。另一方面,按照加菲尔德早就备好的逻辑,它放眼的是未来,2014不中,但保不准名单上会出现2015、2016乃至未来更远年代的诺奖得主。

 

事实上,SCI引用数据究竟能不能预测诺奖,学界当前还存在相当大的异议。学者金格拉斯(Y.Gingras)和华莱士(M. Wallace)2010年做了一项研究,他们对比物理和化学领域的两组数据:逐年统计1901-2007排名前500的高引作者的被引用情况;[[12]] 和1901-2007年330位诺奖得主的被引用情况。统计结果显示,1900-1945年间,诺奖得主在获奖当年的平均被引用次数明显高于其他高引作者,出现一个突出的峰值;但是从1946年至2007年,这样峰值再未出现。这意味着,1900-1945年间,成果引用确实可以看作预测诺奖的有效风向标,但是从1950年代开始,试图凭借成果引用从高引学者中鉴别出诺奖得主,已经完全没有可能。[[13]]

 

金格拉斯两人把解释的理由归结为两点:1950年代以来科研人数在急剧增加;物理、化学领域专业分支在不断细化。如果他们的研究结论成立,这会导致一个加菲尔德不愿意看到的事实,在SCI开发出来的大约20年前,它在“预测”诺奖这件事上就已经失效了。

 

四、学界对SCI的争议

 

值得注意的是,SCI还处于早期推广阶段的时候,在学界已经引发争议。1970年,围绕加菲尔德在《自然》杂志上宣传SCI功能的文章《研究科学的引用索引》——其实就是1965年报告的缩减版(参看本文第三节),[[14]] 一些学者表达了异议。

 

争论焦点主要集中于这个问题:利用SCI论文引用次数来衡量学者的学术水平,是否是一种合理的做法?科学人士的主要观点可归纳如下:[[15]]

引用并不仅仅表示赞同,还包括对前人成果的批评或一般性综述。一些作者为了获得引用,可能有意制造耸人听闻的“诈文”。 


引用带有很大主观性,某些情形下,论文被频繁引用只是因为作者是知名学者,和论文学术水平无关。 


一些学者虽然有着可观的论文引用数量,但引用发生在早前的年代,实际情形是他们当前的学术创造力已经枯竭。 


没有出现在论文参考文献中的成果,并不意味着完全没有影响。一些在相关领域被普遍接受的专业术语,同行在论文中提及一般不会给出原始出处。 


论文引用与奖励、基金申请、职位申请等直接挂钩,会导致配合引用等作假手段。 


SCI在收集处理引用数据的过程中,存在不容忽视的误差。 


对于集体成果,只计算论文第一作者引用次数的做法不合道理。典型例证是生化学家奥利弗·罗瑞(O. Lowry 1910~1996)1951年与另外三位作者共同发表的一篇论文[[16]],在加菲尔德1967年统计的“高引作者前50名”中,罗瑞因这篇论文位居第一,它当时被引次数已达2350次,但另外三位合作者并没有出现在名单上。 


针对这些质疑,加菲尔德公司团队做出了回应,ISI欧洲分公司高管考克尔(A. E. Cawkell)反驳说,学者们列举的SCI缺陷都属于“可能事件”,而非“必然事件”,所以不会影响SCI作为评估手段的有效性,加菲尔德则再次强调诺奖预测的有效性。[[17]]、[[18]]

 

与《自然》杂志类似,《科学》(Science)杂志上两位学者1972年的一篇文章也引发同样争议,他们利用1965年SCI报告对物理学家的研究成果进行评估,得出结论认为只有少数精英科学家对物理学发展做出贡献。[[19]]

 

两份期刊关于SCI的讨论只是短暂一现,随后很快归于沉寂,但这些争议对我们当下重新审视SCI对学界产生的影响及后果,却有很好的参照和启发作用。

 

到1990年代,当一些学者开始意识SCI的使用正在失控,并试图重新质疑其合理性时,SCI“权威学术评估手段”的地位已无可动摇。学界最终“跪倒”在SCI面前的结果是,早期少数学者发出的警告不仅一一应验,甚至其它更夸张、更离谱的事情也正在发生。这样的情形下,回头再看学者阿兰·麦凯(Alan Mackay)1974年《自然》上的文章《发表还是毁灭》(Publish or Perish)——他把SCI称为“学术独裁(tyranny)”,确实具有超前的预见性。[[20]]

 

五、对“影响因子”两项准则合理性的质疑

 

1955年,“影响因子”首次作为一个专门术语出现在加菲尔德在《科学》杂志上的一篇文章中,他在两个地方谈及“影响因子”:[[21]]

通过该系统(注:指科学引用索引),可以有效检索收录期刊论文被哪些文章引用过,这在历史研究中将发挥明显作用,当人们尝试评估某项研究成果的意义,或它对同时期的文献或思想产生的影响时,“影响因子”应该比科学家出版成果的绝对数量更具说服力。

 

对于意义重大的文章,引用索引具有量化价值,它能帮助历史研究者评估文章的影响——这也就是“影响因子”。

 

从这两段话可以看出,加菲尔德最初是将一篇文章的被引用次数当成“影响因子”。

 

后来在1963年的一篇文章中,加菲尔德把“影响因子”定义重新修正为“期刊文章的平均被引用次数”。[[22]] 这主要是为了解决期刊“体量(size)”差异带来的问题。按照格罗斯夫妇首创的传统期刊评估方法,期刊优劣取决于它总的被引用次数,但通常情形下,期刊发表文章的数量越多,获得的引用次数也就越多。对一些“体量”小的期刊而言,传统方法无疑是不公平的。

 

汤森路透现今逐年发布的JCR报告上,影响因子算法的标准定义是:期刊X在前面两年发表的源刊文本(source items)在当年度的总被引用数,除以期刊X在前面两年发表的文章(article)总数量,即为期刊X当年度影响因子的得数。[[23]]其中“源刊文本”,指的是SCI(后来包括SSCI 和A&HCI)任一收录期刊上发表的所有文本。算式表达为:

 

从算式可看出,计算期刊“影响因子”需遵守两项基本准则:

 

第一准则,源刊文本的“引用窗口(citation window)”是两年。通俗的解释就是,SCI期刊文本只在发表后第二、三年度发生的引用,对期刊“影响因子”产生有效贡献——尽管实际上它们可能一直会被引用。

 

加菲尔德在1972年《科学》杂志上的文章中,对这一准则的设定进行了解释(参见该文注释29)[[24]], 他通过逐年统计1964至1970年SCI收录期刊的参考文献,发现发表年限在三年内的比例依次为:31.09%、30.24%、26.60%、25.91%、25.32%、25.18%和23.95%(换一种呈现方式就是,期刊参考文献和注释发表年限在三年以上的比例依次为:68.91%、69.76%、73.40%、74.09%、74.68%、74.82%、76.05%)。

 

从这组数据,加菲尔德还总结出一种趋势,随着SCI收录期刊数量逐渐增加,发表年限三年内的被引用文献比例在逐渐下降——这意味着如果这种趋势保持下去,比例可能越来越小。但不知何故他居然就得出判定,“论文被引用主要发生在发表当年后的两年内”。

 

照理来说,“两年有效引用”作为“影响因子”算法非常重要的一项准则,加菲尔德有必要在文章中(或单独撰文)详细说明缘由,但他居然只用一条注释草草带过。这也难怪一些西方学者在讨论中,甚至无从知晓“两年”标准是按什么依据得来的。[[25]]

 

事实上,针对这一问题,学者格兰采尔(W. Glanzel)和莫伊德(H. Moed)2002年的一篇论文,已经提供了一个非常有力的反驳案例。[[26]] 他们抽样考察医学期刊《柳叶刀》(Lancet)和社会学期刊《美国社会学评论》(American Sociological Review),对两份期刊1980年发表文章在之后十年的平均被引用率进行逐年比较。发现在前面三年,《柳叶刀》1980年论文的平均引用率明显高于《美国社会学评论》,但随着年限逐渐累积,《美国社会学评论》的引用率大大高于《柳叶刀》(参见表4)。

 

这一结果意味着,对医学期刊和对社会学期刊采用同样的“引用窗口”年限并不合理。医学作为最活跃的研究领域,新旧理论的更迭在频繁发生,其中某些成果发表后引发的关注甚至是“爆发式”的。而是在人文社会学领域,新的思想和观点提出后,往往需要等待若干年的“发酵”,才可能引发关注。换言之,汤森路透-ISI逐年公布的“影响因子”结果,很难讲是一个客观的结论。

 

表4:两份期刊1980年发表文章不同年限的平均引用率

 

引用年限

平均引用率

1980-80

1980-81

1980-82

1980-85

1980-89

柳叶刀

0.6

2.4

4.5

9.7

14.0

美国社会学评论

0.2

1.8

4.3

12.1

20.9

 

不过,在“影响因子”被捧上神坛的今天,学界即使意识到这一点,“路径依赖”已让他们别无选择。2003年,加菲尔德对“两年有效引用”的回应,就完全是一副“木已成舟能奈我何”的架势:

 

我们不想等若干年后才了解一份期刊的被引用情况。ISI完全有能力计算3年、5年的影响因子。我们甚至有10年、15年的影响因子数据库,但它们需要单独订阅。[[27]]

 

在这个傲慢的表态中,“影响因子”的合理性是无所谓的,商业利润才是王道——“它们需要单独订阅”。

 

第二准则,“影响因子”算式分母的“文章”只包括“原创研究论文(original research paper)”和“评论(review)”。

 

这一准则专门针对的是那些除了发表原创论文和评论,还发表社论、技术通信、来信、通告、读者来信、科学讯息观察和报告、书评等文本的刊物,当今世界上最知名的几家刊物——《自然》、《科学》、《柳叶刀》、《美国医学会杂志》(The Journal of the American Medical Association),以及《新英格兰医学杂志》(The New England Journal of  Medicine),都属于这一类型。对单纯发表原创论文的期刊,如知名的《现代物理评论》(Reviews of Modern Physics)和《化学评论》(Chemical Reviews),就不需要进行这种区分,因为它们的“源刊文本”数量就等于“文章”数量。

 

这一准则的形成也有一个渐变的过程。1972年,加菲尔德发表在《科学》杂志的一篇文章中,[[28]] 以1967、1968和1969三年的SCI数据为基础,计算1969年度的期刊“影响因子”,他当时的做法是将《自然》、《科学》、《柳叶刀》、《美国医学会杂志》这类刊物上的所有文本都计入算式分母,理由是(参见该文注释28):“全部计入”不失为较为便捷的处理手段;更重要的是,“这些期刊上的非学术文本也是潜在的被引用文本”。

 

这种做法显然对《自然》、《科学》之类的期刊非常不利,庞大的分母直接拉低它们的影响因子,排名结果全都落到40之后(参见表5)。

 

针对这一情况,在1975年首次作为SCI附卷发布的JCR报告中,加菲尔德对规则进行调整,规定分母项只包括三类“学术文本”:原创研究论文(original research articles)、评论文章(review articles)和技术报告(technical notes)。“非学术文本”不再计入的理由是,它们“很难获得引用”。[[29]]、[[30]]

 

分母数量大幅减小对《自然》、《科学》这类期刊的影响因子结果产生了立竿见影的效果——尽管加菲尔德只委婉地承认“部分归结于这个原因”,但相较1969年,它们的排名全部大幅上升,其中《美国医学会杂志》惊人地提升了100位(参见表5)。

 

分母规则在1995年度的JCR报告中再次被调整,范围进一步缩小,“技术报告”被剔除,只保留“原创研究论文”和“评论文章”两项——这一做法基本保持到今天。[[31]]

 

关于“准则二”还有很大的讨论空间,此处姑先指出这一点,后文将做进一步探讨。

 

 

表5:1969、1974年五本知名刊物在不同标准下的影响因子排名结果

 

年份

排名

自然

科学

美国医学会杂志

柳叶刀

新英格兰医学杂志

1969

修改定义前的位数

55

40

127

99

56

1974

修改定义后的位数

38

10

27

8

3

 
相较SCI推广阶段引发的争议,一个饶有意味的对比结果是,尽管“影响因子”从提出到算法定则最终确立,与《自然》和《科学》有着极深的渊源——1955年,它首次作为专门术语出现在《科学》上;1972年《科学》刊登了1969年度期刊“影响因子”报告;1976年,《自然》摘载了JCR报告的减缩版——考虑到JCR在1975年才首次出版,这几乎等同于这两份大牌期刊在帮助它进行市场“预热”和产品“推广”了,[[32]] 而且这两份期刊当时没有出现任何对它的质疑或讨论文章。[[33]]

 

一种可能的解释是,“影响因子”当时没有引起学界的关注。但这种解释不合常理,因为“影响因子”是基于SCI报告的数据得出的,如果SCI存在诸多不合理之处,“影响因子”当然也会存在缺陷,何况加菲尔德提出把“影响因子”作为衡量学术期刊优劣的标准,涉及的同样是学界非常敏感的问题,很难想象学者们能对SCI提出犀利的质疑,对“影响因子”的缺陷却完全视而不见。

 

关于“影响因子”和《自然》杂志之间的微妙关系,笔者将在后续论文“Nature实证研究之四”中,展开进一步的专题研究。

 

六、为商业机构打造高端学术形象

 

ISI创立之前,美国的科技情报通常由政府学术机构牵头采集、整理和公布,套用今天时髦的话来讲,加菲尔德一手开创了科技情报的商业化经营模式。《科学》杂志1978年的一篇文章称他为“把信息王国建立在脚注上的百万富翁”,可谓十分贴切。[[34]]

 

对加菲尔德而言,1964年投产SCI完全是背水一战的商业冒险。为了弥补资金缺口,他把公司20%股权以50万美元价格卖给华尔街风投。SCI当年的市场发售价格为700美元,老年加菲尔德在一次访谈中回忆,它的第一份订单来自美国中央情报局(CIA)图书馆,出人意料的是第二份订单——它来自中国。[[35]]、[[36]]

 

事实证明,加菲尔德对SCI的产品决策堪称“高风险高收益”。SCI从1964年推向市场到1971年短短七年时间,ISI的利润平均每年以27.5%增长,随后又开发了十余款新品,公司业务迅速拓展到全球近十个国家,成为世界第一大科技信息服务咨询公司。[[37]]

 

1988年,加菲尔德把ISI超过50%的股权卖给JPT出版公司(JPT Publishing)。1992年4月,汤森路透以2.1亿美元价格收购JPT出版公司。据汤森路透首席运营官说,交易主要是为了得到ISI,“ISI在全球拥有30万客户,每年净利润约为1500万美元”。[[38]]

 

当前,汤森路透和英国里德·爱斯维尔集团(Reed Elsevier,成立于1993年)、荷兰威科集团(Wolters Kluwer,初建于1836年),共同占据全球情报市场90%的份额。[[39]]

 

除了SCI和JCR这样的“灵魂产品”,ISI开发的其它知名产品还包括:[[40]]

 

目录快讯(CC),1956年首次面市,对各类期刊和书籍的目录进行汇编,以周刊形式出版,订阅者可通过它快速了解相关领域最新发表的前沿消息。CC最早只对管理类期刊的目录进行汇编(前面提到贝尔实验室购买的这就这种),1957年,它将汇编对象拓展到医药、化学、生命科学等领域的学术期刊。作为ISI开发的第一个产品,CC在SCI出现之前一直是公司最赚钱的产品。

 

化合物索引库(Index Chemicus,简称IC),这一数据库除了有助研究者了解新出现化合物的相关研究数据,还可获得重要有机化学期刊对它的评价结果。1960年开发推出后尽管一直只赔不赚,但加菲尔德对其倾注巨大热情,手下四名主要副手集体辞职也未能迫使他终止,IC如今已成为汤森路透的又一热门产品。

 

由于ISI经营的客户对象以学者和学术机构为主,所以尽可能让自身显得“学术”,也是一种非常重要的营销手段。

 

在公司草创阶段,加菲尔德对公司的冠名,已经带有明显的学术包装意味。如果说“尤金·加菲尔德学会”的前用名还显出几分“伪学术”的话,“科学情报研究所”听起来就完全像一家政府科学机构了(这对中国这样的发展中国家来说尤其如此)。加菲尔德非常坦率地承认,他要的就是这种容易引起混淆的效果——为的是与化学摘要(Chemical Abstracts)和国家医学图书馆这类政府学术机构争夺市场,“特别是在国外,‘科学情报研究所’这样的叫法,很容易被当成一家非盈利机构”。[[41]]

 

ISI商业运转正式上轨之后,接纳了两位诺奖获得者成为公司董事会成员,这其中当然也有打造高端“学术”形象的考虑。[[42]]

 

此外,为了拉近和学术圈的关系,ISI为学术机构、大学图书馆设立专项奖学金,奖金可作为这些机构购买ISI产品的抵扣——这其实相当于发放某种商业“抵扣券”。[[43]]

 

当然,最有效的手段还是发表学术论文和参与学术研讨会,产生的效果可谓一举两得,除了提升企业学术形象,还可以把论文发表期刊和研讨会作为ISI产品的推广平台。

 

加菲尔德本人在这方面充分发挥了表率作用,他一生勤奋高产,对倾力打造的各种信息产品相关的科学写作,始终保持着高昂的兴趣——其中不少成果发表在《自然》、《科学》这类被学界认为高端的期刊上。据作者统计,从1950年代至2012年,加菲尔德发表文章400余篇。1986年,他还创办了《科学家》(The Scientist)杂志。

 

ISI的学术“包装”是如此卓有成效,以至有被误导的公众经常写信抗议,指责ISI作为一家政府科技情报机构,履行职责并不到位。为此加菲尔德又不得不反复澄清,表示ISI完全是一家以市场盈利为目的的商业公司。[[44]]

 

七、“黄金俱乐部”的准入门槛

 

加菲尔德1985年写过一篇文章专门谈论他的“生意经”,标题是“为你的钱袋子着想”。[[45]] 大意是,在收录期刊增加、通货膨胀导致成本投入增加的情形下,ISI两种主要产品——CC和SCI的价格涨幅,仍然大大低于行业同类产品的平均增长水平,这主要得自公司不断改进技术,完善产品功能,吸引更多用户,达到了薄利多销的目的。为了贴补成本,《目录快讯》从1982年开始刊登商业广告。[[46]]

 

这些做法都表明,ISI经营方式和一般商业公司并无二致,都要参照成本预算、销售业绩的前提下考虑可能赚取的利润。所以ISI每年都要做严格的预算,控制期刊的收录数量,对什么样的期刊满足收录条件,设定相应的准入门槛。

 

以SCI为例,早期对收录期刊的选择并没有统一标准,主要由加菲尔德的团队根据经验进行鉴选。但人为经验往往存在很大局限,比如,1964年发布的首期SCI报告,居然没收录在科学界享有很高声誉的《哲学通汇》(Philosophical Transactions)[[47]],而另一份当时享有世界声誉的苏联期刊《热工程杂志》(Teploenergetica),直到1968年才首次被收录。[[48]]

 

JCR的出现,为SCI筛选期刊提供了一项相对独立的参照评估指标:通过计算待选刊物的“影响因子”,可以了解它被SCI期刊引用的情况。[[49]]

以此为基础,加菲尔德将SCI筛选收录期刊的标准归纳为三条:

 

待选刊物的SCI引用情况;

 

杂志本身需要满足的各种形式要件(出版周期、编辑团队、作者国际多样性等);

 

相关领域专家的评估意见。[[50]]

 

汤森路透基本沿用了这三条筛选标准。[[51]] 其实,按加菲尔德的说法,这样的规则在早期运用过程中,由于存在成本控制的问题,已经存在“灵活操作”的余地:

 

我们每年做完杂志收录预算,一如既往总有一些杂志出版社或编辑会表达意愿,希望他们的杂志能被收录进来。如果杂志完全满足筛选要求,那怎么办?我们要么告诉杂志主办方等下一年,要么让他们同意自己支付杂志收录的相关费用,这样做可以帮助我们在预算允许的情形下继续经营下去。[[52]]

 

当然,加菲尔德也不忘记澄清,“原则上这是好事。但也造成一些下意识的猜测,认为杂志可以靠钱买进CC或SCI的收录名单。”[[53]]

 

而这样的事也确有发生,1995年8月,《科学美国人》(Scientific American)在一篇文章中批露,墨西哥一家期刊为了能被SCI收录,每年被要求花10万美元订阅ISI的信息产品。[[54]] 汤森路透为此大为光火,威胁要将《科学美国人》告上法庭,后者迫于压力,在10月号上做了更正声明,才算了结此事。[[55]]、[[56]]

 

SCI如今俨然已被打造成学界的“黄金俱乐部”,准入门槛今非昔比,特别在发展中国家,学术期刊一旦被SCI收录,即被看成“权威”的标志。

日常生活中常见的情形是,一些高级“俱乐部”对申请加入的成员,除了必要的资质考量之外,还要求交纳高昂的“会员费”。在SCI面世不到十年的时候,一些符合收录要求的杂志,已经被要求自己为“准入”费用埋单。而如今,在坐落于美国纽约时代广场的汤森路透公司独家经营下,SCI和JCR背后究竟是怎样的光景,确实给人留有很大的想象空间。

 

--------------------------------------------------------------------------------

参考文献

 

[[1]]I.Fuyuno & D.Cyranoski .Cash for papers: putting a premium on publication[J]. Nature.2006,441:792.

 

[[2]]E. Garfield . How it all begain – with a loan from HFC. Current Contents.1980-01-21. 3:5-8.

 

[[3]]W.C. Adair.Citation Indexes for Scientific Literature.American Documentation .1955.6:31-32.

 

[[4]]E.Garfield.How can impact factors be improved.British Medical Journal.1996.313:411-3.

 

[[5]]E.Garfield.Science citation index. Science.1955;122:108-110.

 

[[6]]P. L. K. Gross , E. M. Gross.College libraries and chemical education. Science, 1927, 66 (1713) :385–389.

 

P. L. K. Gross& A. O. Woodford.Serial literature used by American geologists. Science, 1931,73 (1903) : 660–664.

 

I. Hackh. The periodicals useful in the dental library. Bull Med Libr Assoc.1936, 25 (1–2) : 109–112.

 

[[7]]Éric Archambault, Vincent Larivière .History of the journal impact factor: contingencies and consequences[J].Scientometrics.2009. 79: 635-649.

 

[[8]]I. Sher and E. Garfield. New tools for improving and evaluating the effectiveness of research[J]. Research Program Effectiveness, Proceedings of the Conference Sponsored by the Office of Naval Research Washington, D.C., July 27-29, 1965 .

 

[[9]]E. Garfield. Citation Indexes in Sociological and Historical Research[J]. American Documentation, 1963,14 (4):289-291.

 

[[10]]在这篇综述中,加菲尔德对此前的30余篇文章皆有具引:E. Garfield. Of Nobel Class’: Part 1.An Overview of 1S1 Studies on Highly Cited Authors and Nobel Laureates[J].. Current Contents .1992-08. 15:116-126.

 

[[11]]D. Pendlebury.the 1989 Nobel prize in medicine: 20 who deserve it[J].The Scientist .1989-10-02.3( 19): 14;16;19.

A.Martello.Scientists with the right chemistry to win a Nobel[J].The Scientist.1990-09-17.4(18):16-7.

 

[[12]]汤森路透已把SCI数据补充到1900年至当前,可通过Web of Science查询(需订阅)。

 

[[13]]Yves Gingras, M. L. Wallace .Why it has become more difficult to predict Nobel Prize winners: a bibliometric analysis of nominees and winners of the chemistry and physics prizes (1901–2007)[J]. Scientometrics .2010-02, 82( 2): 401-412.

 

[[14]]E. Garfield .Citation Indexing for Studying Science[J].Nature.1970-08-15. 227, 669–671

 

[[15]]D. Croom .Dangers in the Use of the Science Citation Index[J]. Nature .1970-09-12. 227:1173.

P. T. P. Oliver. Citation Indexing for Studying Science[J]. Nature. 1970-08-22.227: 870.

 

[[16]]O.H.Lowry; N.J.Rosebrough; A.L.Farr; R.J.Randall; Protein measurement with the Folin phenol reagent[J]. Journal of Biological Chemistry.1951.193 (1): 265–75.

 

[[17]]A.E.Cawkell. Science Citation Index[J]. Nature .1970-11-21.228:789-790.

 

[[18]]E. Garfield .Citation and Distinction[J]. Nature .1973.242:485.

 

[[19]]J.R. Cole and S. Cole.The Ortega Hypothesis[J].Science.1972-10-27.17(4059):368-375.

 

[[20]]A. Mackay. Publish or perish[J]. Nature.1974-08-30.250:698.

 

[[21]]E.Garfield .Science citation index:a new dimension in indexing[J]. Science .1955.144:649-654.

 

[[22]]E. Garfield, & I. Sher. New factors in the evaluation of scientific literature through citation indexing[J]. American Documentation, 1963, 14(3), 195-201.

 

[[23]]考虑到影响因子定义在本研究系列讨论中的重要性,有必要附上原文:The impact factor of journal X would be calculated by dividing the number of all current citations of source items published in journal X during the previous two years by the number of articles journal X published in those two years.

 

[[24]]E.GarfieldCitaition analysis as a tool in journal evaluation[J]. science. 1972.178:471-479.

 

[[25]]Éric Archambault, Vincent Larivière .History of the journal impact factor:contingencies and consequences[J].Scientometrics.2009. 79: 635-649.

 

[[26]]W.Glänzel, H.Moed.Journal impact measures in bibliometric research[J].Scientometrics, 2002. 53(2) :171–193.

 

[[27]]E.Garfield. The meaning of the Impact Factor[J].International Journal of Clinical and Health Psychology.2003. 3(2):363-369.

 

[[28]]E. Garfield.Citation analysis as a tool in journal evaluation[J].Science.1972-11-03.178(4060):471-479.

 

[[29]]E.Garfield. Preface to Journal Citation Reports-Vol. 9 of SCI .published by Institute for Scientific Information(philadephia).1975.7-8.

 

[[30]]E. Garfield. Journal Citation Reports[J]. Current Contents.1976-08-30.35:7-20.

 

[[31]]1995 Journal Citation Reports. published by Institute for Scientific Information(philadephia). 1996.11.

 

[[32]]E. Garfield. Significant journals of science[J]. Nature.1976-12-16.264:609-615.

 

[[33]]M. Benarie. Significant journals of science[J].Nature .1977-01-20.265, 204

 

[[34]]W.Broad. Librarian turned entrepreneur makes millions off mere footnotes[J]. Science. 1978-11-24. 202:853.

 

[[35]]Transcript of an InterviewConducted byRobert V. WilliamsatPhiladelphia, Pennsylvania. P 30、P 56[EB/OL](1997-07-29)[2015-03-20].http://garfield.library.upenn.edu/papers/oralhistorybywilliams.pdf

 

[[36]] New Books [J].Science.1964-06-05.144(3623):1211.

 

[[37]]S. Lazerow. Institute Scientific Information[M]//Encyclopedia of Library and Information science ed. A. Kent et al.New York:Marcel Dekker.1974.12:89-97.

 

[[38]]The Thomson Corporation History . [EB/OL] [2014-12-05] http://www.fundinguniverse.com/company-histories/the-thomson-corporation-history/

 

[[39]]Laurence Bianchini .Scientific publication : the model and scandals . [EB/OL](2011-07-19)[2015-01-05]

https://www.mysciencework.com/news/2852/scientific-publication-the-model-and-scandals

 

[[40]]作者任职的大学当前就订阅了汤森路透七种信息产品:Web of Science(包括SCI, SSCI, A&HCI等),JCR,BIOSIS Previews(生物科学数据库),Current Contents(目录快讯),Derwent Innovations Index(德温特专利情报数据库),Essential Science Indicators (基本科学指标, ESI),ISI Emerging Market(ISI新兴市场信息服务)。

 

[[41]]E. Garfield .Chemical Information Entrepreneurship – A Personal Odyssey [J].Joseph Priestley Society Symposium “Knowledge: Our Competitive Weapon” at The Chemical Heritage Foundation, Philadelphia, PA. 2004-11-09.

 

[[42]]W.Broad. Librarian turned entrepreneur makes millions off mere footnotes[J]. Science. 1978-11-24. 202:853-857.

 

[[43]]E. Garfield .The ISI grant program[J]. Current Contents.1977-05-02.(18):5-6.

 

[[44]]E. Garfield .The who and why of ISI[J]. Current Contents. 1975-01-06.1:5.

 

[[45]]E. Garfield .More for Your Money: Technology,Marketing, and Hard Work Help ISI Beat Inflation and the Information Explosion[J]. Current Contents.1985-10-14.41:3-8.

 

[[46]]E. Garfield. WillAdvertisingChange Current Contents?—Yes and No[J]. Current Contents.1981-12-14.50:5-6.

 

[[47]]P.Wouters. The Citation Culture. Doctoral Thesis(University of Amsterdam in the Netherlands).1999. 19.

 

[[48]]M. Weinstock. Citation index[J]. Essays of an information scientist.1962-1973.1:208.

 

[[49]]E. Garfield. Is citation frequency a valid criterion for selecting journals?[J]. Current Contents. 1972-4-5. 13:289-290.

通常情形下,SCI收录期刊的参考文献(和注释)的范围要远远大于SCI收录期刊范围本身,所以一份刊物即使没有被SCI收录,也可以统计它被SCI期刊引用的情况,计算它的影响因子。

 

[[50]]E. Garfield.How ISI selects journals for coverage: quantitative and qualitative considerations[J]. current contents,1990-05-28.22:5-13.

 

[[51]]Jim Testa. The Thomson Reuters Journal Selection Process . [EB/OL] (2012-05)[2014-12-05]

http://wokinfo.com/essays/journal-selection-process/

 

[[52]]E.Garfield.Citation Frequency and Citation Impact[J]. Current contents .1973-02-7.5-6.

 

[[53]]E.Garfield. The Economics and Realpolitik of Exponential Information Growth; or, Journal Selection Ain’t Easy! [J].Current Contents.1973-08-22. 34:5-6.

 

[[54]]W. Gibbs. Lost Science in the Third World[J]. Science American.1995-08.92.

 

[[55]]Clarifications and Errata[J]. Science American.1995-10.10.

 

[[56]]Transcript of an InterviewConducted byRobert V. WilliamsatPhiladelphia, Pennsylvania. P 75-77[EB/OL](1997-07-29)[2015-03-20].http://garfield.library.upenn.edu/papers/oralhistorybywilliams.pdf

版权所有©2016 上海交通大学科学史与科学文化研究院   沪交ICP备20160097

技术支持 : 维程互联