栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > R语言

基于R语言的聚类分析

R语言 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

基于R语言的聚类分析

 系统聚类法

目录

 系统聚类法

1.最小距离法计算公式

2.最长距离法计算公式

3.最小距离法

最小距离法聚类分析运行结果

结果分析     

4.最大距离法

最大距离法聚类分析运行结果

结果分析    


1.最小距离法计算公式

                最短距离法是类与类之间按照公式;

 来计算的系统聚类法。它等于类Gp与类Gq中最邻近的两个样品的距离。

2.最长距离法计算公式

                最长距离法是类与类之间采用公式:

 来计算的系统聚类法。它等于类Gp与类Gq中最邻远的两个样品的距离。

 例题:位比较10种不同的葡萄酒的质量,由5位品酒师对每种就的颜色、香味、酸度、添堵、纯度和果味等6项指标进行评价,最低评分为1分。最高10分,得到每种酒的没想指标的平均得分,使用系统聚类的最小距离法和最大距离法进行聚类分析。(例题来源《多元统计分析》--中国人民大学出版社)

颜色x1香味x2酸度x3甜度x4纯度x5果味x6
14.654.225.014.54.154.12
26.326.116.216.856.526.33
34.874.64.954.154.024.11
44.884.684.434.124.034.14
56.736.656.726.136.516.35
67.457.567.67.87.27.18
78.18.238.017.958.316.26
88.428.458.127.888.267.98
96.456.816.526.316.276.06
107.57.327.427.527.16.95

R语言程序代码:

#clipboard 表示复制板上的数据
data<-read.table("clipboard",header = T)

#采用欧式距离计算相似矩阵的,method表示距离计算方法
d<-dist(data,method = "euclidean",diag = T,upper = F,p=2)

#最小值聚类
HC<-hclust(d,method = "single")
plot(HC)

#最大值聚类
HC<-hclust(d,method = "complete")
plot(HC)

3.最小距离法

最小距离法聚类分析运行结果

 图1 10种葡萄酒最小距离法系统聚类树状图

结果分析     

     从图中来看,如果距离为4的话,可分为两类,第一类为{2,9,10,5,6,7,8},第一类为{1,3,4};如果距离取3,则可以分为3类,第一类为{9,10,5,6,7,8},第二类为{2},第三类为{1,3,4}。

4.最大距离法

最大距离法聚类分析运行结果

图2 10种葡萄酒最大距离法系统聚类树状图

结果分析    

从图2来看,如果距离为10,则可以分为两类,第一类为{7,8,9,10,2,5,6},第二类为{1,3,4};如果距离为6,则可以分为3类,第一类为{2,5,6},第二类为{7,8,9,10},第三类为{1,3,4}。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/855665.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号