文章

科研Tips(文献查询、下载和管理)

乏味的科研生活中,文献查阅、下载和整理工作无疑是工作量枯燥的一个环节之一,本文将各类文献的查询和检索方法罗列如下,并引入Zotero这个文献管理软件来管理已经下载的文献。


1. 文献号查询

1.1. 百度学术查询

直接百度学术搜索文章标题

image-20200906105036534

1.2. 图书馆数据库查询

如果是SCI,通过校图书馆-「数据库列表」-「Web Of Science」-「SCIE」搜索文章标题

image-20200906105134588

1.3. ResearchGate查询

ResearchGate(https://www.researchgate.net/)

image-20200906105216130

1.4. 注意事项

注意,有些会议文章可能搜不到 DOI 号;

注意,有些文章可能仅上传于 arXiv,没 DOI 号;

注意,有些专著没有 DOI 号,而是用 ISBN 号。

2. 文献下载

2.1. doi号下载

直接在 DOI 号(如10.1016/j.asr.2017.11.035)前增加 https://doi.org/,然后通过浏览器访问,能重定向到论文原始出处,如果有权限(比如在校园网内且学校购买了相关数据资源),可以直接下载。

image-20200906105644520

2.2. ResearchGate下载

ResearchGate(https://www.researchgate.net/) 上不但能检索到文献的 DOI 号,有的资源还可以直接下载。

image-20200906105759436

2.3. 谷歌学术下载

本方法一般需要翻墙。访问 https://scholar.google.com,搜索文献题目,若该文献有能够下载的来源,右侧会出现包含 [PDF] 的下载连接。

image-20200905151132880

谷歌学术查询的文献,还可以查询到引用信息,作为额外的信息参考。还可以导出为 bibTex 格式。

image-20200905202241257

2.4. sci-hub下载

俄罗斯大佬开发的神器:https://sci-hub.tw

image-20200905202627742

输入 DOI 号就能检索和下载 pdf 文献,虽然可能版本不是最新的,但胜在好用。DOI 号不用教怎么查了吧?某度学术,某歌学术,某 WOS,某 Gate,都可以输入文献名称去查。

2.5. arXiv下载

参考:如何快速下载 arxiv 论文

arXivX依希腊文的χ发音,读音如英语的archive)(https://arxiv.org/)是一个收集物理学、数学、计算机科学、生物学与数理经济学的论文预印本(preprint)的网站,始于1991年8月14日。截至2008年10月,arXiv已收集超过50万篇预印本[2][3];至2014年底,藏量达到1百万篇[4][5]。截至2016年10月,提交率已达每月超过10,000篇[5][6]

arxiv 在中国有官方镜像 http://cn.arxiv.org,通过使用 chrome 插件将 arxiv 的链接自动重定向到中国镜像网站链接即可,这样当你点击一篇文章的arxiv链接后就可以自动到cn.arxiv.org,速度很快。如果 http://cn.arxiv.org/ 仍然难以访问,但是中科院理论物理所也有一个备选网址: http://xxx.itp.ac.cn/ ,但是也不是特别稳定。

首先安装 tampermonkey(油猴插件),这是一款功能强大的脚本插件,可以通过脚本对浏览器上网页进行修改编辑等,更多介绍可以参考 https://zhuanlan.zhihu.com/p/28869740 。这里我们使用该插件对网页中的 arxiv 链接进行重定向到 cn.arxiv.org。

油猴插件在各类浏览器中(如Chrome,Microsoft Edge等)均可以安装。推荐使用 Chrome Webstore 或微软的浏览器插件商城(https://microsoftedge.microsoft.com/addons/Microsoft-Edge-Extensions-Home?hl=zh-CN)下载油猴插件,在 crx4chrome 网站搜索并下载也可以,这里给出crx4chrome网站上tampermonkey插件的下载链接

然后添加 arxiv 重定向脚本。 代码更新时间2017年12年04日,自动转到pdf链接。 代码需要全部复制粘贴,部分看似注释的代码也有用处,代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
// ==UserScript==
// @name        Redirect arxiv.org to CN.arxiv.org/pdf
// @namespace   uso2usom
// @description On any web page it will check if the clicked links goes to arxiv.org. If so, the link will be rewritten to point to cn.arxiv.org
// @include     http://*.*
// @include     https://*.*
// @version     1.2
// @grant       none
// ==/UserScript==

// This is a slightly brute force solution, but there is no other way to do it using only a userscript.

// Release Notes

// version 1.2
// Focus on pdf link only!
// Add '.pdf' link  automatically. Convenient for saving as pdf.

// version 1.1
// Redirect arxiv.org to CN.arxiv.org

document.body.addEventListener('mousedown', function(e){
    var targ = e.target || e.srcElement;
    if ( targ && targ.href && targ.href.match(/https?:\/\/arxiv.org\/pdf/) ) {
        targ.href = targ.href.replace(/https?:\/\/arxiv\.org/, 'http://cn.arxiv.org');
    }
    if ( targ && targ.href && targ.href.match(/http?:\/\/arxiv.org\/pdf/) ) {
        targ.href = targ.href.replace(/http?:\/\/arxiv\.org/, 'http://cn.arxiv.org');
    }
    if ( targ && targ.href && targ.href.match(/https?:\/\/arxiv.org\/abs/) ) {
        targ.href = targ.href.replace(/https?:\/\/arxiv\.org\/abs/, 'http://cn.arxiv.org/pdf');
    }
    if ( targ && targ.href && targ.href.match(/http?:\/\/arxiv.org\/abs/) ) {
        targ.href = targ.href.replace(/http?:\/\/arxiv\.org\/abs/, 'http://cn.arxiv.org/pdf');
    }
    if (targ && targ.href && targ.href.match(/http?:\/\/cn.arxiv.org\/pdf/) && !targ.href.match(/\.pdf/) )
    {
       targ.href = targ.href + '.pdf';
    }
});

最后,测试配置是否成功,下面是 arxiv 上的一篇文章,点击pdf测试下载速度。之后可以手动去掉“cn.”前缀对比速度。 Relation Networks for Object Detection

image-20200905144148277

另外,由于 http://cn.arxiv.org 并不是主站点,是 arxiv 在中国区的镜像,因此更新有大约半天的延迟,对于当天提交的文章,可能更新不及时。对于当天文章可以手动删除“cn.”前缀解决。 如果出现 pdf 正在自动从源文件生成等提示,为正常现象,稍后即可获取pdf论文。

2.6. 中文硕博士论文下载

知网中论文只能下载到caj版本(垃圾知网只坑国人),如果处于校园网内,可以去知网海外版(www.oversea.cnki.net)下载到pdf版(垃圾知网不坑洋人)。

image-20200906110132227

点击Download PDF

image-20200906110206300

从此告别CNKI阅读器,垃圾流氓软件,拜拜了您嘞。

3. Zotero文献管理

文献管理软件可以有效的帮助研究人员管理参考文献,加速论文写作过程。这里介绍开源的文献管理软件 Zotero 的基本功能。注意,此处假设主要以英文论文书写为例,若以中文写作为主要工作,可使用 NoteExpress 作为文献管理软件,一般各高校图书馆均提供学校特别版下载安装,NoteExpress 可方便的从中国知网下载和导入文献。Zotero 官网(https://www.zotero.org/)可以免费下载该软件,软件支持中文。

3.1. 设置数据存储位置

下载安装后,打开「编辑」-「首选项」,切换到「高级」- 「文件和文件夹]选项卡,可以将参考文献索引和存放路径修改到「自定义的数据存储位置」:

image-20200905145730143

3.2. 添加文献条目

  • 英文文献

将下载到本地的 pdf 文献拖入 Zotero 软件界面即可添加该文献,等待一会儿后,软件会自动分析出论文的信息并形成一个条目,并将该文献的 pdf 文件拷贝至前面设置的自定义的数据存储位置,因此刚下载到本地的 pdf 文件即可删除了。

image-20200905144646206

点击右侧的第二栏 “笔记” 可以查看和增删对该论文的笔记

image-20200905144801449

双击该条目,可以打开外部 pdf 查看器来查看论文。

  • 中文文献

需要借助一个插件来让 Zotero 自动抓取中文文献的 metadata。插件 jasminum 下载地址 在此。该插件针对知网下载的文献均可正常抓取,其它如万方下载的文献,将文献的 PDF 文件名名字命名为【文献名.pdf】或者【文献名_第一作者.pdf】也可抓取。

jasminum 实现的功能有:

  • 拆分或合并 Zotero 中条目作者姓和名(也即增加或移除 metadata 中中文姓名之间的逗号)
  • 根据知网上下载的文献文件来抓取引用信息(就是根据文件名)
  • 添加中文PDF/CAJ时,自动拉取知网数据,该功能默认关闭。需要到设置中开启,注意添加的文件名需要含有中文,全英文没有效果
  • 为知网的学位论文 PDF 添加书签

下载得到 .xpi 格式的插件文件后,打开 Zotero,点击【工具】-【插件】打开插件管理器。

image-20200905144924441

然后点击左上角的齿轮-【Install Add-on From File…】,找到并选择刚刚下载的 .xpi 格式的插件文件,安装后根据提示重启 Zotero 完成安装。

image-20200905144924441

image-20200905144924441

image-20200905144924441

然后在导入的中文文献上右击,选择【知网】图标的更新元信息即可。

3.3. 导出文献条目

右键该条目,可以转到 pdf 文件的存放位置(自定义的数据存储位置),或者导出该文献的引文目录。

image-20200905144924441

根据写文章所需要的参考文献格式(此处以 IEEE 为例),选择引文目录,然后选择复制到剪贴板,即可在比如Word中所写论文的参考文献中,插入自动复制的引文条目:

[1] H. Hu, J. Gu, Z. Zhang, J. Dai, and Y. Wei, “Relation Networks for Object Detection,” arXiv:1711.11575 [cs], Jun. 2018, Accessed: Sep. 05, 2020. [Online]. Available: http://arxiv.org/abs/1711.11575.

image-20200905144948669

还可以右键选择「导出条目」导出为 bib 格式的条目信息,即可在 latex 中的 bib 文件插入该参考文献条目以供正文引用。

image-20200906104239391

3.4. 层级管理和同步

Zotero 另一个优点是可以建立多层级的目录树,便于分门别类的整理参考文献条目。

image-20200905150036383

另一个方法是针对每一篇写的文章建立一个目录,将所有引用的参考文献放入其中,这样可以统一将整个目录的所有参考文献导出参考文献列表。

当注册了Zotero账户后,可以方便的将整个文献库进行云端存储和同步,当两地办公写作时,可以在一处更新参考文献库后,在另一处联网同步,即可无缝保持两地的文献库的同步。账户设置位于「首选项」-「同步」中,设置完毕后,点击软件界面右上角的小图标即可进行同步。

image-20200905150512124

更进一步,可以 此处 下载 zotfile 插件。zotfile 可以极大的增强 Zotero 的文献管理功能,比如一键规范所有条目的文献 pdf 文件的标题等。

4. 参考文献

[1] 德谟赛斯. 如何快速下载 arxiv 论文.

[2] strange_jiong. Latex编译出现字体获取不到的情况.

[3] 开心鲨鱼. 配置VScode编辑LaTeX及正反向搜索等设置.

[4] LaTeX工作室. LaTeX技巧932:如何配置Visual Studio Code作为LaTeX编辑器新版更新.

本文由作者按照 CC BY 4.0 进行授权