尽管大多数读者觉得统计分析非常有趣,但为统计分析读入数据以及 把结果导出到其它系统以方便报表编写可能是一件比统计分析更花时间 和难办的差事。
本手册描述了 R 自身以及从 CRAN 获得的一些包里面的 数据导入和导出功能。这里描述的一些包可能还正在开发,但它们已经 提供了一些非常有用的功能了。
除非特别说明,本手册中描述的所有功能可以在各种平台运行的R 中使用。
通常,如R一类的统计系统特别不适合处理大尺度的数据。
其它一些系统在这方面可以比R作的好。本手册的部分要点是
建议用户可以用其它系统做数据处理工作而不是用 R 里面重复的功能(
例如,Therneau 和 Grambsch (2000) 就提到他们喜欢在SAS里面进行数据
处理,然后才用 S 的包 survival 进行数据分析)。
现在,还有几个包允许用其它编程语言(如Java,
perl 和 python)开发的函数直接整合进R代码里面。这样
就可以更加方便地用这些语言的功能。
(见Omegahat项目(http://www.omegahat.org)
的SJava, RSPerl 和 RSPython包,和来自
CRAN的rJava包)
值得注意到是 R 和 S 一样都来自Unix的小的可重用工具的传统,
因此,在数据导入前和结果导出后用awk 和 perl 等
工具处理数据都是值得推崇的。
Becker, Chambers & Wilks (1988, 第 9 章)中的案例分析就是这样的
一个例子。其中,在 S 数据输入前用Unix工具检验和处理数据。
R 自己也是采用这种策略,比如用 perl 而不是R
处理自身的帮助文件数据库,函数 read.fwf开始就是调用一个
perl代码直到后来明确在运行时不能依赖 perl。
现在,传统的Unix工具被很广泛的使用,包括在Windows系统上。