大数据分析--R语言开始之旅
前言:关于R
在R的官方教程里是这么给R下注解的:一个数据分析和图形显示的程序设计环境(A system for data analysis and visualization which is built based on S language.)。
R的源起
R是S语言的一种实现。S语言是由 AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业 软件,它基于S语言,并由MathSoft公司的统计科学部进一步完善。后来Auckland大学的Robert Gentleman 和 Ross Ihaka 及其他志愿人员开发了一个R系统。R的使用与S-PLUS有很多类似之处,两个软件有一定的兼容性。
R is free
R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。
R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输入,可实现分支、循环,用户可自定义功能。
R是一个免费的自由软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的,在那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得。
R的特点
(1) 有效的数据处理和保存机制。
(2) 拥有一整套数组和矩阵的操作运算符。
(3) 一系列连贯而又完整的数据分析中间工具。
(4) 图形统计可以对数据直接进行分析和显示,可用于多种图形设备。
(5) 一种相当完善、简洁和高效的程序设计语言。它包括条件语句、循环语句、用户自定义的递归函数以及输入输出接口。
(6) R语言是彻底面向对象的统计编程语言。
(7) R语言和其它编程语言、数据库之间有很好的接口。
(8) R语言是自由软件,可以放心大胆地使用,但其功能却不比任何其它同类软件差。
(9) R语言具有丰富的网上资源
R语言环境安装
接下来从R语言的安装折腾起(本人使用的是win7 32位,其他平台可触类旁通)。
R语言的安装文件可以在http://www.r-project.org/下 载。
页面的左侧点击“CRAN”(Comprehensive R Archive Network)即可。
C*AN是大多数自由软件采用的发布方式,除了R以外还有为TeX准备的CTAN,为Perl弄的CPAN等等。CRAN在世界各 地有很多镜像,中国的中科院,厦大,中科大等都有镜像。
下载好安装文件后即可直接安装,不过要注意以下两点:
把默认安装目录中的R版本号去掉,比如要是R告诉你装在C:/Program Files/R/R-3.0.0/,不要接受这个结果,把它改成C:/Program Files/R/。这个对于后面安装RStudio和knitr等都有一些关系。
避免安装在中文目录下。这可以避免很多不必要的编码问题。
安装完成后,桌面会有一个R应用快捷方式。双击打开
>help.start() 开启帮助文档
安装RStudio
推荐在安装完R语言后安装RStudio。RStudio是一个R语言的IDE(integrated development environment),集合了各种功能,并且也是跨平台和开源的。http://www.rstudio.com/ide/download/
现在提供桌面板和服务器版,个人用户下载做桌面版即可。下载完成后安装在默认的安装 目录,然后就可以使用了
>help.start() 开启帮助文档 沙发{:3_46:}
页:
[1]