栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > R语言

r语言 新增一列数字类型

R语言 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

r语言 新增一列数字类型

不连续更新,总结一些实用的R语言操作知识。


  1. 如何在RStudio中更新R版本
install.packages("installr")

2. 带P值的箱型图

Input data:

我想看看任意一列在两种类型上有没有显著差异,即可以用秩和检验求P-value来看差异性。

我们基于ggpubr包为ggplot添加p值和显著性标记。

关键函数:stat_compare_means()

代码:

library(tidyverse)
library(ggpubr)
library(ggplot2)
library(reshape2)

Orgin.data <- read.table(file ="input_data.csv",header = T,sep = ',', encoding = "UTF-8")
fragment_size <- Orgin.data[c('type','L')] #选中type这一列和你想要的分析的那一列(如L列)
data.melt<-melt(fragment_size)

ggplot(data=data.melt,aes(type, value, fill=type))+
geom_boxplot()+
xlab("sample type") + ylab("Value")+
stat_compare_means(aes(group = type))

结果:

初学者追可能犯错的地方往往是数据结构问题,此代码从csv中导入后的数据为:

使用melt处理后的data为:

(第一列为type,第二列为变量名,第三列为数值)

这是我的一个例子,比较了T这一列在两种type上的差异性,结果如下:

可以看出P值很小很小,具有显著差异。

3. 规定范围的热图/相关性矩阵

有些相关性矩阵中的相关性系数的范围并不是-1到1,可能集中在某一小的范围。此时如果颜色使用默认参数则会导致图的效果很差,看不出差异。此时则可以手动设置颜色参数。

我们使用RColorBrewer包

代码:

data <-read.csv("./input.csv",header=T,row.names= 1)
mydata<-as.data.frame(lapply(data,as.numeric))
a<-cor(mydata, method = "pearson", use = "complete.obs")
write.csv(a,"./a.csv",row.names=FALSE,quote = FALSE)

library(corrplot)
library(RColorBrewer)
mypal = brewer.pal(n = 9, name = "Blues")
color = c(mypal,mypal)
corrplot.mixed(a,upper.col = color, lower.col = 'white', is.corr = FALSE,tl.pos="d",tl.cex=0.7, cl.lim = c(0.9, 1))
corrplot(corr = a,add=TRUE, type="lower", method="number",order="AOE",diag=FALSE,tl.pos="n", cl.pos="n")

input data:

Out result:

此时将相关系数处于0.85-1的数值用蓝色进行表示出来。

4. 关于线和颜色

ref: https://www.cnblogs.com/ljhdo/p/4805480.html

颜色:

https://zhuanlan.zhihu.com/p/32746407

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/855550.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号