不连续更新,总结一些实用的R语言操作知识。
- 如何在RStudio中更新R版本
install.packages("installr")
2. 带P值的箱型图
Input data:
我想看看任意一列在两种类型上有没有显著差异,即可以用秩和检验求P-value来看差异性。
我们基于ggpubr包为ggplot添加p值和显著性标记。
关键函数:stat_compare_means()
代码:
library(tidyverse)
library(ggpubr)
library(ggplot2)
library(reshape2)
Orgin.data <- read.table(file ="input_data.csv",header = T,sep = ',', encoding = "UTF-8")
fragment_size <- Orgin.data[c('type','L')] #选中type这一列和你想要的分析的那一列(如L列)
data.melt<-melt(fragment_size)
ggplot(data=data.melt,aes(type, value, fill=type))+
geom_boxplot()+
xlab("sample type") + ylab("Value")+
stat_compare_means(aes(group = type))
结果:
初学者追可能犯错的地方往往是数据结构问题,此代码从csv中导入后的数据为:
使用melt处理后的data为:
(第一列为type,第二列为变量名,第三列为数值)
这是我的一个例子,比较了T这一列在两种type上的差异性,结果如下:
可以看出P值很小很小,具有显著差异。
3. 规定范围的热图/相关性矩阵
有些相关性矩阵中的相关性系数的范围并不是-1到1,可能集中在某一小的范围。此时如果颜色使用默认参数则会导致图的效果很差,看不出差异。此时则可以手动设置颜色参数。
我们使用RColorBrewer包
代码:
data <-read.csv("./input.csv",header=T,row.names= 1)
mydata<-as.data.frame(lapply(data,as.numeric))
a<-cor(mydata, method = "pearson", use = "complete.obs")
write.csv(a,"./a.csv",row.names=FALSE,quote = FALSE)
library(corrplot)
library(RColorBrewer)
mypal = brewer.pal(n = 9, name = "Blues")
color = c(mypal,mypal)
corrplot.mixed(a,upper.col = color, lower.col = 'white', is.corr = FALSE,tl.pos="d",tl.cex=0.7, cl.lim = c(0.9, 1))
corrplot(corr = a,add=TRUE, type="lower", method="number",order="AOE",diag=FALSE,tl.pos="n", cl.pos="n")
input data:
Out result:
此时将相关系数处于0.85-1的数值用蓝色进行表示出来。
4. 关于线和颜色
ref: https://www.cnblogs.com/ljhdo/p/4805480.html
颜色:
https://zhuanlan.zhihu.com/p/32746407



