被心心念念的DUKE
以三行情书拒绝
暴饮暴食一整天
不眠不休不罢悔
渐渐重拾做事的专心
Emac: 社科工作者的全家桶
「作为一名初步入社会科学的研究生,你应该使用什么样的软件去做你的研究工作呢?更重要的是,你应该使用什么样的原则去指导你的选择呢?」这篇文章将会提供一些可能的选项与答案。
简短点说:希望读完本文,你能找到高效率的文本编辑器来写文章 (现在有很多不同的选择); 使用R
或者STATA
来分析定量数据; 将研究文件以适当的格式 (纯文本文件一般最佳) 合适存储以减少错误;将研究项目放在可进行版本控制的系统;将所有材料进行常规的自动化备份;不要因为那些复杂的小工具,应用,软件包而陷入泥淖:要知道这些工具是来帮助你完成你的日常工作的,但是我们常常因为这样或者那样的调整(tweak)或更新而浪费很多时间。为了帮你上手,我将会简单地讨论一下 Emac 这个社会科学研究者的全家桶,这是一个非常实用,但却功能强大的懒人包,不仅是适用于数据分析,也是写作利器。除此之外,我也将会介绍一些其他软件。
简介
你可以拥有非常高效的方式,使用各种不同的软件来进行你自己的研究,不仅易于维护,而且可以复制。这就是我不鼓励每一个人都过渡到我所使用的软件环境上来的主要原因(我的原则是,如果我不能够给他们行动中或之后提供技术支持,那我并能不尝试着去劝说所有人都换成我所使用的软件。)所以此处的讨论并不是要向你证明只有一种系统化做事的方式,但是,我认为,如果你刚刚步入研究生院,是一名社会科学研究生,比如说,社会学,经济学,或者政治学的学生,那么你可能应该想一想你该如何组织并管理你的工作内容。之所以这么说,主要有两个原因,首先,从之前的身份过渡到研究生院是一个非常适合做出个人转变的时期,与成长为成熟的研究生的阶段相比,初步入研究生院,你做出改变的过程中,惯性会很小,不太会有很高的代价;此外,在社会科学中,文本处理和数据管理技术常常没有被很好地教授给学生,这也就是说,你很有可能只是照搬你导师或者方法学课上教授的数据处理方式和风格,继续死磕下去,又或者,你只是模仿着你的同学们所做的东西。依循着这些路子,你会对你的状态和所学满意,也可能未必,因此我们有必要检视一下我们手中的选择了。
此外在本文,有两点需事先说明。本文的受众针对的是刚开始念社会科学研究生的学生,有些读者可能对很多文中介绍的东西都已经相当熟悉,即便如此,文中的有些部分可能也会很有趣,因为我不断更新文中引用的软件名单,以努力跟上时代步伐。不过,在之后我可能会着重强调(安利)某些软件包,但是其本意却不是这些软件或者是小玩意本身。有条不紊的真谛(禅)并不在于高大上的软件,就像是真正帮你完成事情的路不是买一本漂亮的Moleskine笔记本,不幸的是,这条路只能靠你自己。
你应该使用什么电脑机器呢?
让我们穿越时空,回到最最最最早期,可能你首先面临的选择就是,我应该使用什么样的设备,在这一台机器上运行什么样的系统? 目前市场上的首选大致是微软的 Windows,苹果的 Mac OS X,以及一些其他的 Linux 发行版系统 (相对于内核版而言)。这些平台或多或少都对自己在大众刻板印象中的缺陷做出了改进。
于我而言,现在的市场环境下,就用户的数量而言,Windows 占据市场的主导地位,在最近这些年它长久以来的安全性,设计以及易用性问题,都得到了一定程度的纾解。Mac OS X 系统仅能够在苹果制造的机器上运行 ( 不过现在也有很多人在用「黑苹果)。
在过去,很难将苹果机器和 Windows 的 PC 进行 直接的比较,但现今已经不是换了河山。一般而言,如果一台 PC 机器与 苹果的设备配置越相近,那么二者的价格差异就越有可能消弭。不过,苹果在市场上并不能在各价位通吃,所以我们总是可以通过组装一些比苹果更加便宜的 PC 机器 (虽然可能少一些特性),并且一般我们如果有特殊需求,或者是偏好的话,配置一台 PC 来得更加简单 (可能很多人 不需要苹果的Retina显示屏,而需要更多的存储空间)。
因为苹果目前使用的是基于英特尔架构的硬件,安装和运行 Windows 并不复杂,而且苹果有意为此设计了Boot Camp 助理的性能。除了同时安装 Windows 和 OS X,第三方的虚拟机软件也可供使用(目前最流行的 VMWare,Parallels 大概八十美元左右),让你在OS X 上无缝对接 Windows 和 Linux。因此,如果你想要尝试配备所有主流的操作系统,那么苹果产品可能是你唯一的选择。
Linux 非常的稳定,安全,而且免费。而且有各种以用户为中心的发行版本,比如说相比较以往而言, Ubuntu 整合集成得更强,使用环境也变得对用户更加友好了。过去的Linux发行版中,最臭名昭著的就是安装,升级和更新过程太浪费时间,也足够让人崩溃。现在Linux的包管理系统愈发成熟,这一点已经有了很大改善。不过有一点还没有变,虽然这是他们本身并不想学的,Linux的使用者们,在某时某刻却总得被迫学习一些关于操作系统的核心设计。
我现在使用的是 Mac OS X,而且我也推荐你这么做。在此处的讨论也在某种程度上反映了我的偏好,但是那些其他的选择也是可行的,我在后面所提到的大部分工具在这三大平台上都可以找到,所以我将不再花时间来劝服你选择某一个系统。
仅仅是为了确保你知道你干了什么
对于任何学术文章中规范的数据分析,无论你怎么实行,你总要遵循一系列的基本准则。可能其中最重要的一条就是,在工作过程中,
举例说,
为什么你要大费周章地来做此事呢?不可避免的,
第二条是
第三点是重复性的或者是容易犯错的过程,如果可能,应该尽量自动化处理。(软件工程师们将这一点概括为「DRY」也就是不要自我重复)。这一条可以帮助我们更好地检查和纠正错误。不是简单地一遍一遍复制粘贴代码,对数据的不同部分来做同样的处理,而是要写一个通用的函数,当你需要它,你就调用它。在你写参考文献的时候,使用软件自动进行文献管理,那么你就不必在投稿的时候重新组织,重新排版。
在很多场景下,你都可以践行此原则。你可以使用 Word
,Endnote
和 SPSS
,或者 Textpad
和 Stata
的组合,你也可以就用一大摞黄色拍纸本,一个计算器,一只剪刀和一大盒文件夹。但是必须承认,软件有高下之分,有些软件确实比另一些要更容易帮我们完成想要的目标。不太像类似微软的Word
编辑器的软件包,
大部分你所写的论文,数据和书籍都会以不同的形式存储下来:文本,数据分析的结果(可能是以表格或者图),以及笔记和。因此,减少错误。在另一个部分,我将会介绍一些软件应用和设计工具来让你更加方便地完成这一工作。它们与三大系统完美契合,而且免费。事实上,这些应用在各方面都不算完美,而且有的还不太好学。但是研究生阶段的研究和写作学起来也很棘手。专业化的工作需要专业化的工具,不幸的是,虽然它们的功能强大,但很多却对用户没那么友好。
编辑文本
如果你需要做一些量化分析,那么你真的需要一个好的文本编辑器。我认为可以说与学术文章创作的过程类似,需要进行大量的修改。
安装指南(MAC OS X)
- 开始之前的准备
-
如果你想与LaTeX,R,Git,Pandoc以及其他工具一起使用,那么你可能需要预先安装它们
xcode-select --install
用Org-mode或knitr来进行文艺编程
Org-mode
是 Emacs
中的一种模式,原本的设计主要是为了更加方便的记笔记,列提纲和管理任务清单。这一模式是Emacs
设计精神的良好体现,它的用户们。Org-mode
一个非常好的扩展包就是Org Babel
,
这与 Sweave
的工作原理非常类似,除了在用 LaTex
写文章报告或是文档时, 或者用R写代码的时候稍有不同。轻量mark-up语言,
Max Scheler