科研Tips(文献查询、下载和管理)
乏味的科研生活中,文献查阅、下载和整理工作无疑是工作量枯燥的一个环节之一,本文将各类文献的查询和检索方法罗列如下,并引入Zotero这个文献管理软件来管理已经下载的文献。
1. 文献号查询
1.1. 百度学术查询
直接百度学术搜索文章标题
1.2. 图书馆数据库查询
如果是SCI,通过校图书馆-「数据库列表」-「Web Of Science」-「SCIE」搜索文章标题
1.3. ResearchGate查询
ResearchGate(https://www.researchgate.net/)
1.4. 注意事项
注意,有些会议文章可能搜不到 DOI 号;
注意,有些文章可能仅上传于 arXiv,没 DOI 号;
注意,有些专著没有 DOI 号,而是用 ISBN 号。
2. 文献下载
2.1. doi号下载
直接在 DOI 号(如10.1016/j.asr.2017.11.035)前增加 https://doi.org/,然后通过浏览器访问,能重定向到论文原始出处,如果有权限(比如在校园网内且学校购买了相关数据资源),可以直接下载。
2.2. ResearchGate下载
ResearchGate(https://www.researchgate.net/) 上不但能检索到文献的 DOI 号,有的资源还可以直接下载。
2.3. 谷歌学术下载
本方法一般需要翻墙。访问 https://scholar.google.com,搜索文献题目,若该文献有能够下载的来源,右侧会出现包含 [PDF]
的下载连接。
谷歌学术查询的文献,还可以查询到引用信息,作为额外的信息参考。还可以导出为 bibTex 格式。
2.4. sci-hub下载
俄罗斯大佬开发的神器:https://sci-hub.tw
输入 DOI 号就能检索和下载 pdf 文献,虽然可能版本不是最新的,但胜在好用。DOI 号不用教怎么查了吧?某度学术,某歌学术,某 WOS,某 Gate,都可以输入文献名称去查。
2.5. arXiv下载
arXiv(X依希腊文的χ发音,读音如英语的archive)(https://arxiv.org/)是一个收集物理学、数学、计算机科学、生物学与数理经济学的论文预印本(preprint)的网站,始于1991年8月14日。截至2008年10月,arXiv已收集超过50万篇预印本[2][3];至2014年底,藏量达到1百万篇[4][5]。截至2016年10月,提交率已达每月超过10,000篇[5][6]。
arxiv 在中国有官方镜像 http://cn.arxiv.org,通过使用 chrome 插件将 arxiv 的链接自动重定向到中国镜像网站链接即可,这样当你点击一篇文章的arxiv链接后就可以自动到cn.arxiv.org,速度很快。如果 http://cn.arxiv.org/ 仍然难以访问,但是中科院理论物理所也有一个备选网址: http://xxx.itp.ac.cn/ ,但是也不是特别稳定。
首先安装 tampermonkey(油猴插件),这是一款功能强大的脚本插件,可以通过脚本对浏览器上网页进行修改编辑等,更多介绍可以参考 https://zhuanlan.zhihu.com/p/28869740 。这里我们使用该插件对网页中的 arxiv 链接进行重定向到 cn.arxiv.org。
油猴插件在各类浏览器中(如Chrome,Microsoft Edge等)均可以安装。推荐使用 Chrome Webstore 或微软的浏览器插件商城(https://microsoftedge.microsoft.com/addons/Microsoft-Edge-Extensions-Home?hl=zh-CN)下载油猴插件,在 crx4chrome 网站搜索并下载也可以,这里给出crx4chrome网站上tampermonkey插件的下载链接。
然后添加 arxiv 重定向脚本。 代码更新时间2017年12年04日,自动转到pdf链接。 代码需要全部复制粘贴,部分看似注释的代码也有用处,代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
// ==UserScript==
// @name Redirect arxiv.org to CN.arxiv.org/pdf
// @namespace uso2usom
// @description On any web page it will check if the clicked links goes to arxiv.org. If so, the link will be rewritten to point to cn.arxiv.org
// @include http://*.*
// @include https://*.*
// @version 1.2
// @grant none
// ==/UserScript==
// This is a slightly brute force solution, but there is no other way to do it using only a userscript.
// Release Notes
// version 1.2
// Focus on pdf link only!
// Add '.pdf' link automatically. Convenient for saving as pdf.
// version 1.1
// Redirect arxiv.org to CN.arxiv.org
document.body.addEventListener('mousedown', function(e){
var targ = e.target || e.srcElement;
if ( targ && targ.href && targ.href.match(/https?:\/\/arxiv.org\/pdf/) ) {
targ.href = targ.href.replace(/https?:\/\/arxiv\.org/, 'http://cn.arxiv.org');
}
if ( targ && targ.href && targ.href.match(/http?:\/\/arxiv.org\/pdf/) ) {
targ.href = targ.href.replace(/http?:\/\/arxiv\.org/, 'http://cn.arxiv.org');
}
if ( targ && targ.href && targ.href.match(/https?:\/\/arxiv.org\/abs/) ) {
targ.href = targ.href.replace(/https?:\/\/arxiv\.org\/abs/, 'http://cn.arxiv.org/pdf');
}
if ( targ && targ.href && targ.href.match(/http?:\/\/arxiv.org\/abs/) ) {
targ.href = targ.href.replace(/http?:\/\/arxiv\.org\/abs/, 'http://cn.arxiv.org/pdf');
}
if (targ && targ.href && targ.href.match(/http?:\/\/cn.arxiv.org\/pdf/) && !targ.href.match(/\.pdf/) )
{
targ.href = targ.href + '.pdf';
}
});
最后,测试配置是否成功,下面是 arxiv 上的一篇文章,点击pdf测试下载速度。之后可以手动去掉“cn.”前缀对比速度。 Relation Networks for Object Detection
另外,由于 http://cn.arxiv.org 并不是主站点,是 arxiv 在中国区的镜像,因此更新有大约半天的延迟,对于当天提交的文章,可能更新不及时。对于当天文章可以手动删除“cn.”前缀解决。 如果出现 pdf 正在自动从源文件生成等提示,为正常现象,稍后即可获取pdf论文。
2.6. 中文硕博士论文下载
知网中论文只能下载到caj版本(垃圾知网只坑国人),如果处于校园网内,可以去知网海外版(www.oversea.cnki.net)下载到pdf版(垃圾知网不坑洋人)。
点击Download PDF
从此告别CNKI阅读器,垃圾流氓软件,拜拜了您嘞。
3. Zotero文献管理
文献管理软件可以有效的帮助研究人员管理参考文献,加速论文写作过程。这里介绍开源的文献管理软件 Zotero 的基本功能。注意,此处假设主要以英文论文书写为例,若以中文写作为主要工作,可使用 NoteExpress 作为文献管理软件,一般各高校图书馆均提供学校特别版下载安装,NoteExpress 可方便的从中国知网下载和导入文献。Zotero 官网(https://www.zotero.org/)可以免费下载该软件,软件支持中文。
3.1. 设置数据存储位置
下载安装后,打开「编辑」-「首选项」,切换到「高级」- 「文件和文件夹]选项卡,可以将参考文献索引和存放路径修改到「自定义的数据存储位置」:
3.2. 添加文献条目
- 英文文献
将下载到本地的 pdf 文献拖入 Zotero 软件界面即可添加该文献,等待一会儿后,软件会自动分析出论文的信息并形成一个条目,并将该文献的 pdf 文件拷贝至前面设置的自定义的数据存储位置,因此刚下载到本地的 pdf 文件即可删除了。
点击右侧的第二栏 “笔记” 可以查看和增删对该论文的笔记
双击该条目,可以打开外部 pdf 查看器来查看论文。
- 中文文献
需要借助一个插件来让 Zotero 自动抓取中文文献的 metadata。插件 jasminum 下载地址 在此。该插件针对知网下载的文献均可正常抓取,其它如万方下载的文献,将文献的 PDF 文件名名字命名为【文献名.pdf】或者【文献名_第一作者.pdf】也可抓取。
jasminum 实现的功能有:
- 拆分或合并 Zotero 中条目作者姓和名(也即增加或移除 metadata 中中文姓名之间的逗号)
- 根据知网上下载的文献文件来抓取引用信息(就是根据文件名)
- 添加中文PDF/CAJ时,自动拉取知网数据,该功能默认关闭。需要到设置中开启,注意添加的文件名需要含有中文,全英文没有效果
- 为知网的学位论文 PDF 添加书签
下载得到 .xpi
格式的插件文件后,打开 Zotero,点击【工具】-【插件】打开插件管理器。
然后点击左上角的齿轮-【Install Add-on From File…】,找到并选择刚刚下载的 .xpi
格式的插件文件,安装后根据提示重启 Zotero 完成安装。
然后在导入的中文文献上右击,选择【知网】图标的更新元信息即可。
3.3. 导出文献条目
右键该条目,可以转到 pdf 文件的存放位置(自定义的数据存储位置),或者导出该文献的引文目录。
根据写文章所需要的参考文献格式(此处以 IEEE 为例),选择引文目录,然后选择复制到剪贴板,即可在比如Word中所写论文的参考文献中,插入自动复制的引文条目:
[1] H. Hu, J. Gu, Z. Zhang, J. Dai, and Y. Wei, “Relation Networks for Object Detection,” arXiv:1711.11575 [cs], Jun. 2018, Accessed: Sep. 05, 2020. [Online]. Available: http://arxiv.org/abs/1711.11575.
还可以右键选择「导出条目」导出为 bib 格式的条目信息,即可在 latex 中的 bib 文件插入该参考文献条目以供正文引用。
3.4. 层级管理和同步
Zotero 另一个优点是可以建立多层级的目录树,便于分门别类的整理参考文献条目。
另一个方法是针对每一篇写的文章建立一个目录,将所有引用的参考文献放入其中,这样可以统一将整个目录的所有参考文献导出参考文献列表。
当注册了Zotero账户后,可以方便的将整个文献库进行云端存储和同步,当两地办公写作时,可以在一处更新参考文献库后,在另一处联网同步,即可无缝保持两地的文献库的同步。账户设置位于「首选项」-「同步」中,设置完毕后,点击软件界面右上角的小图标即可进行同步。
更进一步,可以 此处 下载 zotfile 插件。zotfile 可以极大的增强 Zotero 的文献管理功能,比如一键规范所有条目的文献 pdf 文件的标题等。
4. 参考文献
[1] 德谟赛斯. 如何快速下载 arxiv 论文.
[2] strange_jiong. Latex编译出现字体获取不到的情况.
[3] 开心鲨鱼. 配置VScode编辑LaTeX及正反向搜索等设置.
[4] LaTeX工作室. LaTeX技巧932:如何配置Visual Studio Code作为LaTeX编辑器新版更新.