这个问题非常适合我,我是从上个月接手一个项目的统计与数据分析工作,这个项目本来是我一个学长在做的,但是他去别的地儿做博后了,就留给了我,麻烦就麻烦在,给了我两部分的代码,一部分是python的,主要是做一些机器学习,特别是clustering。还有另一部分是R语言,这是我的主管写的,因为她只会R语言,并且做出来的图确实要比python的好看一点。
由于时间紧迫,我也没时间把R语言那部分代码改成python,另外就算改了,也变相的增大了主管的代码阅读和理解难度。
所以我基本上可以说是自学的R语言,当然我并没有把R语言从头到尾学了个遍,因为它本来就是个工具语言,学了项目用到的那部分就足够了,之后又需要的再继续补充就好了。
T-test | t.test() | 比较两组(参数) |
Wilcoxon test | wilcox.test() | 比较两组(非参数) |
ANOVA | aov()或anova() | 比较多组(参数) |
Kruskal-Wallis | kruskal.test() | 比较多组(非参数) |
基本上一个月多点,我掌握了这些内容。
做了一些图,包括bar chart, boxplot,heatmap 等
对于学习资料这一块,由于时间紧迫,我没有看任何的书和视频,因为之前也学过不少的编程语言,看书和视频都效率挺低效的,然后要是想基础非常扎实,还是很建议的。
主要包括两部分,一部分是R语言的环境安装,另一部分就是R studio的安装。
建议直接参考这篇文章
2. R studio安装
下载地址:RStudio
安装方法:下载和安装R、RStudio !
R 语言教程 | 菜鸟教程,这个就不讨论了,菜鸟编程出品的教程对于新手入门非常友好,你可以在网页端直接运行代码。
R-w3schools:这个也是一个常用的R语言学习入口,可以巩固下语法以及基本的数据结构等。
28 基本R绘图 | R语言教程:这个是我比较喜欢的一个入门教程,质量还可以
29 ggplot作图入门 | R语言教程:ggplot的教程,一定要看一遍
R语言添加p-value和显著性标记 - 生信人:ggpubr和统计的结合部分,强推。既然都学了ggpubr,没道理不加统计数据
R语言:文件操作_偷闲阁-CSDN博客:抛砖引玉,遇到没见过的文件类型,自己查下就好
31 R初等统计分析 | R语言教程:还是这个系列教程,非常详细
另外一个小tips:
我绝大多数的工作就是用这几行代码
my_comparisons <- list(c("0.5", "1"), c("1", "2"), c("0.5", "2")) ggboxplot(ToothGrowth, x="dose", y="len", color = "dose",palette = "jco")+ stat_compare_means(comparisons=my_comparisons)+ # Add pairwise comparisons p-value stat_compare_means(label.y = 50) # Add global p-value
其实语法非常简单,最麻烦的就是如何灵活的应用table(), which(), dataframe这几个R语言常用的工具。
qinwf/awesome-R:awesome系列,懂得都懂
Mounment/R-Project:简单的R语言项目推荐