栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

R语言进行系统聚类分析并作图(数据来源国家统计局)

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

R语言进行系统聚类分析并作图(数据来源国家统计局)

系列文章目录

第一篇:R语言和RStudio安装,载入TXT、CSV和XLSX(利用RODBC)文件


文章目录
  • 系列文章目录
  • 前言
  • 一、国家统计局采集数据
  • 二、用R语言对数据进行系统聚类分析
    • 1.载入数据文件
    • 2.计算距离矩阵和最长距离法聚类
    • 3. 绘制谱系图
    • 4. 显示聚类结果
  • 总结


前言

本文讲述如何到国家统计局采集数据,并利用R语言进行系统聚类分析的过程。


一、国家统计局采集数据

进入国家统计局,在顶部菜单栏的统计数据处,选择数据查询,进入国家数据.

本文使用的数据是2016年我国各省市运输线路长度(铁路营业里程+公路营业里程)。
在顶部菜单导航栏选择“地区数据-分省年度数据”,在左侧的菜单栏先选择“指标-运输与邮电-铁路线路长度”,再选择“地区-全部地区”,在筛选条件处指标设置为铁路营业里程(万公里),时间设置为2016,导出为csv文件。接下来导出公路营业里程的数据文件。
对表格进行处理,铁路线路长度=铁路营业里程+公路营业里程。将文件命名为dataone.csv。

二、用R语言对数据进行系统聚类分析 1.载入数据文件

注意,此处文件的编码方式默认是GBK,毕竟是政府网站导出的数据。

data<-read.csv("D:/dataone.csv",fileEncoding = "GBK")
2.计算距离矩阵和最长距离法聚类
distance <- dist(data)  #计算距离矩阵
data.hc <- hclust(distance) #最长距离法聚类
3. 绘制谱系图
plot(data.hc, hang = -1) #绘制谱系图
re <- rect.hclust(data.hc, k = 5) #分为5类

4. 显示聚类结果
for (i in 1:5) {
print(paste("第",i,"类"))
print(data[re[[i]],]$地区)
}


总结

以上就是用R语言对国家统计局采集的“2016全国各省市运输线路长度”数据的系统聚类分析过程。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/878944.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号