本文中将会列举笔者认为可行的三种获取中英文文献的方法,即:
通过一些线索最终获取到某篇论文全文的方法。
首先对三种方法所用到的平台进行简要介绍,其次对中国科研人员可能遇到的文献文件格式 PDF 与 CAJ 进行介绍,最后辅以三个论文下载案例分别从知网海外版、Sci-Hub 与谷歌学术进行文献下载来帮助读者形成感性认识。
本文只会介绍获取某一篇论文的方法,而不会涉及到如何如何挑选优质的论文,如果您有这方面的需求,不妨参考这篇文章:如何找到优质音乐、电影以及论文?。另外由于笔者为计算机背景,并没有在人文社科方面的论文下载经历,因此不确定本文是否会对人文社科方向的同学有所帮助。
从何处下载?
下载论文全文一般需要通过全文数据库,比较著名的全文数据库有:
在后文中笔者将会对这些网站进行简要介绍。
国内常见论文格式有哪些?
Portable Document Format (PDF)
PDF(Portable Document Format 的简称,意为“可携带文档格式”),是由Adobe Systems用于与应用程序、操作系统、硬件无关的方式进行文件交换所发展出的文件格式。PDF文件以PostScript语言图象模型为基础,无论在哪种打印机上都可保证精确的颜色和准确的打印效果,即PDF会忠实地再现原稿的每一个字符、颜色以及图象。
China Academic Journals (CAJ)
CAJ 为中国学术期刊全文数据库英文缩写( China Academic Journals);CAJ同时也是中国学术期刊全文数据库中文件的一种格式。可以使用CAJ全文浏览器来阅读。
CAJ全文浏览器是中国期刊网的专用全文格式阅读器,本款阅读器是光盘国家工程研究中心、清华同方知网(北京)技术有限公司的系列产品,它支持中国期刊网的CAJ、NH、KDH和PDF格式文件。它可以在线阅读中国期刊网的原文,也可以阅读下载到本地硬盘的中国期刊网全文。
非常不推荐这种格式,中国知网开发的 CAJ 阅读器简直就是垃圾,开发者水平低下,网络请求阻塞 UI(如:搜索一个文章,整个界面就会卡住。)
什么是 DOI?
A DOI (Digital Object Identifier) is a unique alphanumeric identifier applied to a specific piece of intellectual property, particularly one presented in an online environment -- be that object a book, a scientific paper, a song, an image, or something else. Unlike a conventional Web address, or URL, a DOI specifies not the location of an online object, but rather its content; a DOI is thus a "persistent" identifier, and remains associated with the object irrespective of changes in the object's Web address((What is a DOI?)).
中国知网(CNKI)海外版
China National Knowledge Infrastructure(CNKI),中国国家知识技术设施,于 1995 年正式立项,是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目。中国知网为该工程的主要访问平台。CNKI依托其主导产品《中国学术期刊全文数据库》((关于我们 - 中国知网))。
中国知网在不登录的状态下为一个免费的索引数据库,在登陆的状态下为全文数据库。
在国内知网,某些论文只有 CAJ 版本可以下载,但由于前文中提到的 CAJ 格式的封闭性以及阅读工具糟糕的阅读体验,笔者曾经尝试过使用各种方法将 CAJ 格式转换为 PDF 格式,均以失败告终。
最终在知乎的一篇文章((知网上PDF文件下载的问题怎么解决? - 知乎))中找到一个非常好用的方法,即在知网海外版((中国知网 - 海外版))搜索相同的论文,知网海外版一般会提供论文的 PDF 版本。(绝大多数情况是这样,暂时笔者唯一遇到的找不到资源的情况是“专利”类型的文献在海外版不能搜索到,其他类型暂时还没有遇到不能命中的情况)
谷歌学术
谷歌学术((谷歌学术))是一个可以免费获取的学术搜索引擎,有很多文献也可以直接通过谷歌学术来进行下载,但需要翻墙使用。
Sci-Hub
Sci-Hub ((Sci-Hub)) 是一个全文数据库,目前免费提供大约 8200 万学术论文(截至:2020 年 06 月 16 日),由哈萨克斯坦的一位女研究生 Алекса́ндра Аса́новна Элбакя́н 建立。该网站的核心理念有三条:
- knowledge to all
- no copyright
- open access
Our mission is to remove any barrier which impeding the widest possible distribution of knowledge in human society!
三个案例 & 三种途径
案例一:通过知网海外版下载论文 PDF 版
本方法只针对于拥有知网论文下载权限的用户,如:购买了知网数据库的高校的学生等。如果您没有知网的下载权限,请移步其他方法。
待下载论文题目:《跟踪与数据中继卫星星间链路捕获和跟踪仿真分析》
前文中提到了知网国内版与海外版的区别,建议您抛弃掉知网国内版,投向知网海外版的怀抱。
首先在知网国内版使用标题进行搜索,并发现只有 CAJ 格式可以下载,没有 PDF 版。
打开知网海外版,使用相同关键字进行搜索。
搜索之后进入文献的详情页面。
此时已经出现了 “Download the Full-text (PDF)” 的按钮,当您没有登陆的时候是无法下载 PDF 的,点击按钮之后会跳转到登陆页面。
由于现在疫情并未结束,您可能并没有机会回到学校,因此需要使用学校的账号登陆,但海外版并没有提供“校外登陆”的功能,因此这里需要特别处理的是:
- 打开知网国内版
- 使用“校外登陆”功能进行登陆
- 然后切回知网海外版的标签,即可正常下载
这个操作可以成立的理论依据是用户的登陆状态是保存在 $_COOKIE['Ecp_LoginStuts']
中的,该 Cookie 是存在 cnki.net
这个域下的,因此理论上登陆了知网国内版即相当于登陆了 cnki.net
域下的所有子域名提供的服务。
案例二:通过 Sci-Hub 下载论文 PDF 版
待下载论文题目:《Pixy: a static analysis tool for detecting Web application vulnerabilities》
Sci-Hub 可以通过 URL, PMID / DOI 或 search string 进行论文下载,在本案例中,已知信息为论文题目,使用 Sci-Hub 直接搜索标题会失败,如图:
这里提供两个解决方案:
- 稍后再尝试搜索,因为出现这种情况可能是临时性的
- 通过搜索得到文献的 DOI,使用 DOI 进行搜索
通过谷歌找到该论文是发表在 2006 IEEE Symposium on Security and Privacy 上的,并且 DOI 为:10.1109/SP.2006.29
重返 Sci-Hub 的主页使用 DOI 进行搜索即可成功下载到论文。 在页面右侧嵌入的 PDF 页面部分,点击下载或在 PDF 内容中点击右键另存为即可。建议您更多得使用 DOI 去进行检索,因为 DOI 的设计本身就是为了唯一标识一篇数字文档的,因此不会出现通过标题搜索到的文献不是你想要的或者由于标题输入不准确导致检索不到文献的情况。
案例三:通过谷歌学术下载论文 PDF 版
待下载论文题目:《Polar Coding for the Broadcast Channel with Confidential Messages and Constrained Randomization》
使用谷歌学术以论文标题作为关键字进行搜索,结果页面第二列如果存在 “[PDF]” 字样则说明存在 PDF 可以直接下载,点击该链接即可在新标签页预览该 PDF 文件,在预览界面即可保存该 PDF。