arXiv.org1是一个在线预印本数据库(图1),现由美国康乃尔大学arXiv团队维护,提供全球用户免费搜索及下载文章,目前收藏的论文篇数已超过一百万篇,以下将简单的整理介绍arXiv.org的缘起和服务,以及arXiv未来服务扩展的可能方向。
图1:arXiv.org主页(https://arxiv.org)
一、arXiv.org简介
arXiv.org在线预印本数据库,原名LANL预印本数据库(xxx.lanl.gov),于1991年由金斯帕(Paul Ginsparg)博士所开发(图2),金斯帕博士为理论物理学家,重要研究成果包含与威尔森(Kenneth G Wilson)合作而知名的Ginsparg-Wilson fermion2。金斯帕一开始开发arXiv.org主要是为收录高能物理学领域的预印本,使原本不易取得的预印本得以广大流通。后来由于获得广大的接受,于是逐渐扩大到物理学其它领域,目前收录的文章亦包含数学、计算科学、计量生物、计量金融、统计等领域,Nature杂志并在2011年适逢其满20周年时特别以专文报导3,可见其在学术领域的重要性。
图2:ArXiv开发者Paul Ginsparg博士
由于预印本没有审查机理,且通过公开预印本可以提早宣告自己的研究成果,并可以在接受期刊审查前取得同侪的评论意见做为改善的方向,所以目前许多领域研究者在投稿前都会先将文章上传至arXiv.org,过去20多年的重要论文几乎都可以在arXiv.org上找得到。除前述期刊文章外,arXiv.org也收藏许多研讨会会议论文、专题介绍文章或讲义,例如 SLAC eConf数据库4所收录各研讨会论文、TASI5 Summer School的课程讲义等,许多都可在arXiv.org上取得。因此大大的提升研究成果及知识的交流,甚至改变了传统研究成果传播模式,例如俄罗斯数学家帕瑞尔曼(Grigori Perelman)只把他证明的庞卡赫猜想(Poincaré conjecture)文章6公开于arXiv.org,而没有投至正式期刊。
二、arXiv.org服务
arXiv.org数据库提供许多集成应用服务,以下简单介绍常用的浏览(含文章下载)、检索、及数据库串联集成等服务。
首先,在浏览方面,arXiv.org在主页即依学科分类,并提供各学科领域当日(new)或最近一周(recent)的文章链接,让用户可快速取得相关领域最新研究成果。各文章并提供预印本全文下载,及正式出版期刊DOI链接。另外arXiv.org并与 INSPIRE(高能物理文献数据库)7及ADS(天体物理学数据库)8合作,进一步提供文章的参考书目链接及被引用链接,大大增进用户查找相关文章的便利性。
在检索方面,arXiv.org提供了相当简洁且方便的查找界面,主要有下列三种查找方式:
(一)简要检索:提供用户通过文章的文献识别码直接查找文章。
图3:arXiv.org简要检索界面
(二)进阶检索:提供用户通过输入或组合作者、篇名,或摘要等关键字查找文章。
图4:arXiv.org进阶检索界面
(三)全文检索:提供用户以关键字查找全文。
图5:arXiv.org全文检索界面
通过上述三种方式,方便用户可依需求及信息,快速查找所需要的文章。
在数据库串连集成方面,arXiv.org除与INSPIRE及ADS等数据库串联以提供文章找文章服务外,亦可让作者将著作数据下载至所属机构的典藏系统,及提供OAI-PMH、API及RSS等整批诠释数据下载服务9,让数据的应用更为弹性及方便,例如在Google检索查找学术文章,许多全文下载链接其实是直接串联至arXiv.org数据库。另外,arXiv.org也提供作者将自己在arXiv.org的作者帐号与其ORCID10帐号串联,让作者在arXiv.org的著作可以正确串连到其在其他数据库的数据,进一步帮助解决了研究者间姓名重复问题。
三、2016年用户调查报告11
为提升arXiv.org服务水准,美国康乃尔大学arXiv团队于今年会员大会前进行了用户使用调查。在这次调查中,有关现有服务提升方面,用户普遍希望可以强化查找的功能,例如优化作者搜索、提供非英文文献搜索等,另外,还包括改善Email或RSS消息通知服务,以及提供下载次数或浏览次数统计,或提供参考文献的电子链接等;在添加功能方面,主要希望通过调查以了解用户对添加数据串联与社区服务功能的看法。其中,用户普遍赞同添加BibTex引文下载或参考文献链接等数据串连功能,对于添加推文系统或引用分析等社区服务功能,则正反意见相当,有待未来再更进一步研究。
另外,该团队并特别针对论文品质管控机理进行调查,调查结果显示,大部分用户对arXiv.org目前投稿文章的管控机理表示满意,但希望对文章是否抄袭应进行检查,另外有用户认为应该寻找更开放的同侪审查制度,使质与量能兼顾。
图6:文章管控机理用户意见统计
四、结语
信息的集成与快速流通让许多旧有的限制逐渐被打破,arXiv.org对于论文的发表与传播提供了一个新的方向与可能性,大大提升研究成果的曝光度。
参考文献:
- arXiv.org 网址: https://arxiv.org/.
- 金斯帕与威尔森合著论文链接:
http://journals.aps.org/prd/abstract/10.1103/PhysRevD.25.2649. - Nature报导文章:
http://www.nature.com/nature/journal/v476/n7359/full/476145a.html. - SLAC eConf数据库为由美国史丹福大学SLAC国家加速器实验室所开发,目的为收录高能物理或相关领域会议论文并提供查找服务,相关介绍及数据库网址:
https://www.slac.stanford.edu/econf/index.html. - TASI的全称为Theoretical Advanced Study Institute,每年于科罗拉多大学波德分校举办为期4周的高能物理学和天体物理学之暑期课程,相关消息网址:
http://www.colorado.edu/physics/events/summer-intensive-programs/theoretical-advanced-study-institute-elementary-particle-physics - 帕瑞尔曼证明庞卡赫猜想文章链接: https://arxiv.org/find/all/1/au:+perelman_Grisha/0/1/0/all/0/1
- INSPIRE数据库网址:https://inspirehep.net/
- ADS数据库网址:http://adswww.harvard.edu/
- arXiv 诠释数据介接功能说明:https://arxiv.org/help/bulk_data.
- ORCID网址:http://orcid.org/
- arXiv 2016年用户调查报告:
https://confluence.cornell.edu/display/culpublic/arXiv+User+Survey+Report;jsessionid=A37DD567F14C4EE84AFCC03CBB26CF26. - 台大学术库(Academic Hub)信息平台网址:http://ah.ntu.edu.tw/.
by michiwu