栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

PCA 主成分分析的实例程序

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

PCA 主成分分析的实例程序

import numpy as np
from sklearn.decomposition import PCA
from sklearn import datasets
import matplotlib
import matplotlib.pyplot as plt




#加载数据
data = np.loadtxt(open("./data/task1.csv","r"),delimiter=",",skiprows=0)
#设置主成分参数:pc个数,数值求解器的类型
pca = PCA(n_components=10, svd_solver='full')
#得到score vectors 
Data_transformed = pca.fit(data).transform(data)
#输出第一个对象在first PC 上的值,即score vectors 的第一行
print(np.round(Data_transformed[0][0],3))
#2输出第一个对象在second PC 上的值
print(np.round(Data_transformed[0][1],3))
#得到variance explained 
explained_variance = np.cumsum(pca.explained_variance_ratio_)

#3当使用前两个主成分时的variance explained
print(np.round(explained_variance[1],3))

plt.plot(np.arange(10), np.round(explained_variance,3), ls = '-')
plt.show()
#4variance explained 大于0.85时应该使用前几个主成分
for i in range(0,10):
    if explained_variance[i]>0.85:
        print(i+1)
        break
#5
plt.plot(Data_transformed[:60, 0], Data_transformed[:60, 1], 'o', markerfacecolor='red', markeredgecolor='k', markersize=8)
plt.show()

使用score vectors 和 loading vectors 重构原始图像

import numpy as np
scores = np.genfromtxt('./data/task12_score.csv', delimiter=';')
loadings = np.genfromtxt('./data/task12_loading.csv', delimiter=';')
values = np.dot(scores,loadings.T)
import matplotlib.pyplot as plt
#1
plt.imshow(values, cmap='Greys_r')
plt.show()

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/744729.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号