来自美国波士顿
更专业的论文润色机构
400-110-1310

咨询学术顾问:400-110-1310

服务时间:周一至周日,9:00-23:00

建议反馈/客户投诉:Editsprings@163.com

微信扫码二维码,添加学术顾问企业微信

您还可以点击在线咨询按钮,与人工客服直接对话,无需等待,立马接入。

在线咨询
欢迎关注“艾德思EditSprings”微信公众号

关注微信获取最新优惠和写作干货,
随时手机询价或咨询人工客服,更可实时掌握稿件
进度,加速稿件发表。

微信扫描二维码关注服务号

史上引用次数最高的100篇论文有多少是诺奖级别的?EditSprings艾德思

Nature自然科研 | 2017/01/22 00:00:00  | 2361 次浏览

《自然》在此探究那些历史上引用量最高的论文。

发现高温超导体,确定DNA双螺旋结构,首次观测到宇宙膨胀加速……这些科研突破都收获了诺贝尔奖和国际声望,但是报告这些发现的论文却无一跻身有史以来引用次数最高的百篇论文之列。

引用指的是在论文中引述前人的研究成果,是作者表明其方法、观点和发现来源的标准方式。引用次数一般被用作衡量一篇论文重要性的粗略指标。50年前,Eugene Garfield发表了科学引文索引(SCI),SCI是追踪科学文献引用次数的首次系统性尝试。为纪念SCI诞生50周年,《自然》杂志邀请目前拥有SCI的汤森路透公司列出了有史以来引用次数最高的100篇论文。此次统计涵盖了汤森路透Web of Science的全部内容,Web of Science是SCI的在线版本,其中也包括社会科学、艺术人文、会议论文和一些书籍数据库。纳入统计的论文的发表时间为1900年至今(2014年10月)。

结果令人惊讶。首先,引用次数要达到惊人的12119次才能跻身百强榜,许多最为著名的论文都没有上榜,而少数上榜的著名论文的确属于经典发现,比如首次观测到碳纳米管(排名第36位)。但是,上榜的绝大多数都是描述实验方法或软件的论文。现在,这些发现已成为了各自领域内所必不可少的工具。

例如,有史以来上引用次数最多的是1951年发表的一篇论文,描述了一种确定溶液中蛋白质含量的测定方法。迄今为止,该论文的引用次数已超过305000次,这曾让论文的第一作者、已故美国生物化学家Oliver Lowry感到困惑不已。“虽然我知道它实际上算不上一篇伟大的论文……但是它的反响是如此之大,我还是不免暗自得意,”他在1977年如此写道。

学术文献的庞大数量意味着百强论文都极其超群。汤森路透的Web of Science包含约5800万条文献记载,如果将其比作乞力马扎罗山,那么引用次数最高的100篇论文仅相当于山顶的1厘米。只有14499篇论文的引用次数超过1000次,约占1.5米的高度(请参阅“论文如山”)。与此同时,山麓部分的论文可能只被引用了一次——它们约占所有文献的一半。

没有人完全明白为什么有些论文高居“山顶”,而有些论文名气虽大,但引用次数却一般,不过研究人员的习惯或可解释一部分原因。荷兰科学和技术研究中心的主任Paul Wouters表示,许多关于研究方法的论文“成为了一种标准引用,好让其他科学家明白作者在做的是什么样的研究”。科学家的另一种常见做法使得真正的基础性发现(比如爱因斯坦的狭义相对论)的引用次数低于其应得水平:这些发现是如此的重要,以至于很快便进入课本,或者被当作耳熟能详的术语,不需要添加引用就能直接纳入正文。

引用次数中也充满了其他干扰因素。举例来说,论文引用的总量增加了,但发表时间早的论文有更多的时间来累积引用量。生物学家倾向于比物理学家更频繁地引用他人的研究成果。而且,并非所有领域发表的论文数量都是一样的。因此,现代文献计量学家在衡量一篇论文的价值时,会避免采用简单地计量引用次数这种粗陋的方法:相反,他们更偏向于比较发表时间接近、领域相当的论文的引用次数。

汤森路透的名单也不是唯一的排名系统。谷歌学术也为《自然》编制了自己的百强著作名单(请参阅“谷歌百强著作排名”)。谷歌学术的名单有更大的引用量作为基础,因为谷歌的参考文献是从更大(但分类不佳)的文献库,包括大量书籍中筛选的。在谷歌编制的著作名单中,经济学论文较为突出。谷歌学术的名单也包括了汤森路透没有分析的书籍。但在科学论文方面,两份名单有许多重合。

虽然引用次数存在种种缺陷,但这种老式的“名人堂”做法依然有其价值。其它暂且不表,它至少可以提醒我们科学知识的本质:为了取得激动人心的科学进步,研究人员依赖于相对默默无闻的论文来描述实验方法、数据库和软件。

成千上万次的引用将一些介绍关键研究方法的论文推上了科学的乞力马扎罗山之巅,它们至关重要,却鲜少引起关注。下面,《自然》杂志将带领各位读者认识其中一二。

Photo by Kyle Bean; Design by Wesley Fernandes/Nature



生物技术


数十年来,引用次数最高的百强论文一直被蛋白质生物化学主导。1951年发表的一篇论文介绍了测定蛋白质含量的劳里法(Lowry),一直稳居第一。不过许多生物化学家表示,劳里法和与之竞争的布拉德福蛋白质定量法(发表该方法的论文排名第三)都已经有点过时了。排名第二的论文介绍的是用于另一种蛋白质分析的Laemmli缓冲液。这些技术的支配地位可归因于细胞及分子生物学领域的高引用量,在这些领域内,这些技术仍然是不可或缺的工具。

在百强论文所描述的生物技术中,至少有两项获得了诺贝尔奖。排名第四的论文描述的DNA测序方法为已故的Frederick Sanger赢得了1980年的诺贝尔化学奖。排名第63位的论文描述的是聚合酶链式反应(PCR),一种复制DNA片段的方法,它为美国生物化学家Kary Mullis赢得了1993年的诺贝尔奖。这两种方法帮助科学家探索和操控DNA,推动了延续至今的遗传学研究革命。

其它方法受到的赞誉更少一些,但也并非籍籍无名。20世纪80年代,意大利癌症遗传学家Nicoletta Sacchi与波兰分子生物学家Piotr Chomczynski在美国合作,发表了一种从生物样本中提取RNA的迅速而廉价的方法。随着该方法的广泛流行(目前引用数排名第五),Chomczynski对该技术进行了改良,取得了专利权,并创建了一个销售试剂的公司。目前任职于美国罗斯威尔帕克癌症研究所的Sacchi表示,她并没有从中获得大量金钱报酬,但看到许多伟大的发现建立在她的研究基础之上,她感到心满意足。举例来说,这项技术对非编码短RNA分子研究的爆炸式增长功不可没。“从科学角度来说,我认为那才是一种巨大的奖励,”她说。 


生物信息学


Sanger的研究成果推动了基因测序领域的快速发展,这推高了介绍序列分析方法的论文的排名。一个重要的例子是基本局部比对搜索工具(BLAST),二十年来,对于研究基因和蛋白质行为的生物学家来说,这是一个无人不知的工具。用户只需要在网络浏览器中打开程序,插入一个DNA、RNA或蛋白质序列,不出几秒钟,他们就能看到来自成千上万种生物体的相关序列,还有与这些序列功能有关的信息,甚至还有相关文献的链接。BLAST是如此的受欢迎,以至于关于这一程序不同版本的论文在名单上出现了两次,分别位列第12和第14位。

但是,受引用习惯变化的影响,BLAST被Clustal挤到了后面。Clustal是BLAST的一个补充工具,可以一次比对多个序列。Clustal让研究人员得以描述不同生物体序列之间的演化关系,在看似不相关的序列中发现匹配,并预测在基因或蛋白质特定位点发生的变化可能会对其功能产生什么影响。一篇1994年的论文描述了该软件的用户友好型版本ClustalW,目前排名第10位。关于一个较新的版本ClustalX的一篇1997年论文排名第28位。

开发ClustalW的团队来自德国海德堡的欧洲分子生物学实验室,当初设计的是让该程序在个人计算机,而非大型计算机上运行。不过,在来自私营公司的计算机科学家Julie Thompson于1991年加入实验室后,该软件改头换面。“原来的程序是生物学家写的——我很想找个委婉的方式来表达这一点,”Thompson说,她现在就职于法国遗传学、分子与细胞生物学研究所。Thompson重新编写了程序,帮助它应对当时产生的基因组数据的数量和复杂性,并将它改进得更易于使用。

BLAST和Clustal背后的团队对彼此的论文排名都存有好胜之心;不过他们之间的竞争十分友好,都柏林大学学院的生物学家、Clustal成员Des Higgins说。“BLAST是个颠覆性的工具,他们所获的每一次引用都是理所应得的。”


系统发生学



另一个被基因组测序拉高排名的领域是研究物种间演化关系的系统发生学。

排名第20位的论文介绍了邻接法,这种方法根据物种间演化距离的一些测度,比如遗传变异,来快速高效地找到大量生物在系统发生树上的位置。它将有亲缘关系的生物联系起来,一次一对,直到系统树解析完成。20世纪80年代,体质人类学家斋藤成也在加入根井正利在得克萨斯大学的实验室后帮助设计了这项技术,以研究人类演化和分子遗传学。当时,这两个领域正开始迎来信息爆炸。

“当时,我们体质人类学家面临的情况有点像今天的大数据,”目前任职于日本国立遗传学研究所的斋藤说。邻接法让研究人员有望在不耗尽计算资源的情况下,用大规模数据集构建出系统发生树。(在另一篇排名前100位的论文中,文中的Clustal程序算法也借鉴了这种策略。)

排名第41位的论文描述的是如何将统计学应用到系统发生学中。1984年,华盛顿大学的演化生物学家Joe Felsenstein改编了一种名为自助法(Bootstrap)的统计工具,以推断演化树不同部分的准确性。Bootstrap对一个数据集多次重复采样,然后使用得到的估计结果的方差来确定单个分支的置信度。虽然这篇论文累积引用次数的速度不快,但到了20世纪90年代至21世纪初,分子生物学家开始意识到在预测中使用这种技术的必要性后,它的流行程度大为上升。

Bootstrap的概念由斯坦福大学的统计学家Bradley Efron于1979年提出。Felsenstein认为这一概念远比自己的工作更基础,但他把这种方法应用在了解决生物学问题上,这意味着他的工作得以被更为广泛的研究者群体引用。Felsenstein获得的高引用数也是他当时忙得不可开交的结果,他说自己把所有内容都塞进了一篇论文里,而不是发表多篇有关相同主题的论文,后一种做法可能会稀释单篇论文获得的引用次数。“我没法就相同的东西再多写四篇论文,”他说。“这是因为我太忙了,而不是我特别有原则的缘故。”


统计学


芝加哥大学的统计学家兼统计史专家Stephen Stigler表示,虽然百强论文中有许多是关于统计学的,但“对我们统计学家来说,它们完全不是最重要的”,而是已被证明对广大科学家最有用的。

在很大程度上,这种交叉成功源于不断从生物医学实验室涌现的数据。例如,被引用最频繁的统计学论文(排名第11位)是美国统计学家Edward Kaplan和Paul Meier在1958年发表的,它能帮助研究人员找到某一群体(如临床试验的参与者)的生存模式。这篇论文介绍了现在被称为卡普兰-迈耶估计(Kaplan–Meier)的统计量。排名第二的统计学论文(居第24位)是英国统计学家David Cox在1972年发表的论文,他在文中进一步拓展了这种生存分析,将性别和年龄等因素包含在内。

卡普兰-迈耶论文是一匹黑马,一开始几乎没有获得任何引用,直到20世纪70年代,随着计算能力的飞速上升,让非计算机专家也能使用该方法后,情况才有改观。统计方法的简洁性和易用性也提高了这一领域论文的受欢迎程度。排名第29位的是英国统计学家Martin Bland和Douglas Altman发表的一篇论文,文中介绍了一种以可视化方式展现两种测量方法一致性的方法,现在称为Bland–Altman图。另一位统计学家比Bland和Altman早14年提出了相同的观点,但是Bland和Altman用易于使用的方式呈现了这种方法,从此为他们的论文赢来了大量引用。

百强论文中最老和最新的统计论文讨论的是相同的问题——数据多重比较,但它们来自极为不同的科学环境。美国统计学家David Duncan1955年发表的论文(排名第64位)能比较几个分组,而以色列统计学家Yoav Benjamini和Yosef Hochberg于1995年发表的有关控制错误发现率的论文(排名第59位)则适用于来自基因组学或神经科学成像等领域的数据,这些领域需要比较以数十万计的数据,其规模是Duncan难以想象的。正如Efron所说:“这展示了计算机起初缓慢,随后加快对统计理论和统计实践产生影响的过程。”


谷歌百强著作排名


Web of Science并非唯一可用的引用索引。谷歌学术也为《自然》编制了有史以来引用次数最高的前100部著作名单。其中三分之二为汤森路透未包括的书籍。“人们一直将焦点放在期刊上,但别忘了,书籍也自成一个世界,”领导谷歌学术团队的软件工程师Anurag Acharya说。在谷歌编制的名单中,排名第4位的是一本名为《分子克隆》(Molecular Cloning)的指南书,它是分子生物学实验室技术的基石。Acharya指出,谷歌的名单表明研究论文也能产生和书籍一样的影响力。在谷歌和汤森路透提供的两份排名中,排名前三的论文是一样的,只是各自顺序不太一样。


谷歌学术还编制了一份只包括论文的百强名单,其中许多与Web of Science的名单重合。不过,可以明显看到的是,只有三分之一出头的论文和前一份名单不一样,其中,有许多经济学和心理学论文上榜,这或许是因为相比较之下,这些领域的论文获得的来自书籍的引用更多。举例来说,排名第21位的是1976年发表的一篇关于公司管理行为的论文(M. C. Jensen & W. H. Meckling J. Financ. Econ. 3, 305–360; 1976),谷歌名单显示它获得了45,119次引用,但是Webof Science显示的引用次数仅为8,372次(谷歌给出的大部分引用次数都高于Web of Science,但是相差5倍很不寻常)。在新入围谷歌学术名单的论文中,排名最高的是Claude Shannon于1948年发表的论文(第4名),它标志着现代信息论的诞生(C. E. Shannon Bell Syst. Tech. J .27, 379–423; 1948。谷歌学术名单显示其引用次数为69,273次,而Web of Science给出的引用次数为10,239次——刚好跌出前100名。



密度泛函理论(DFT)


上一篇:有稿就收的经济类期刊,几乎不退稿

下一篇:学渣学霸都有福了,国家图书馆免费开放175个数据库-EditSprings艾德思

特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。

凡注明来源为“EditSprings”的论文,如需转载,请注明来源EditSprings并附上论文链接。

最热论文