R在Mac上的一些配置

最近在Coursera上学一门数据分析的课程,因此得用用R。照例,总结一下Mac上的一些R配置,希望能帮到Mac的中文用户。

用Apple自己的包做并行加速

R的并行加速,最简单是用BLAS,也是其自带支持的;此外比较多人用的就是OpenBLAS和ATLAS。这两个都是需要单独编译包的。其实Apple自己就提供了并行运算的库,这里介绍的最简单方式就是直接使用每个Mac OS X系统里自带的库。

两条指令搞定:

cd /Library/Frameworks/R.framework/Versions/Current/Resources/lib
ln -sf /System/Library/Frameworks/Accelerate.framework/Versions/Current/Frameworks/vecLib.framework/Versions/Current/libBLAS.dylib libRblas.dylib

如果需要恢复调用R自带的库:

ln -sf libRblas.0.dylib libRblas.dylib

从实际效果来看,运行R-benchmark-25.R来对比,大概可以从30多秒下降到9秒多(Retina MacBook Pro 2013late高配)。有兴趣装OpenBLAS的话,应该还能进一步提升。

SublimeKnitr的安装与配置

Knitr 是目前我知道的、中国人对R世界的最大贡献,一般来说是在RStudio上安装这个包后,支持在编辑器里用markdown、latex语法,同时嵌入R代码,编译后代码块会送到R来执行,最终形成一份HTML的报告(当然在Mac上就非常方便转为PDF)。包括Cousera上Duke University的这门数据分析与统计推断课程,Project都是用RMarkdown写并最终提交PDF。