栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

sklearn数据集操作2

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

sklearn数据集操作2


可在线下载(Downloadable)的数据集
sklearn.datasets.fetch_

20类新闻文本数据集:
该数据集包含了关于20个话题(topic)的18000条新闻报道,这些数据被分为两个子集:训练集和测试集。


20组新闻文本数据集API用法详解







野外带标记人脸数据集:fetch_lfw_people()
fetch_lfw_pairs()

这是一个在互联网上收集的带标记的著名人物人脸集合,以Jpeg格式存储,官方网址:https//vis-www.cs.umass.edu/lfw/。每一张图片都包含一个居中对齐的人脸。典型的任务是”人脸验证face verification“:给两张图片,用二元分类器来判断是否是同一个人。

”人脸识别face recognition or identification“:给一张未知的人脸图片,在人脸库里面查找匹配,将这张脸到底是谁给认出来。

不管是人脸识别还是人脸验证,他们都依赖于一个人脸检测算法。所以,LFW中的人脸都是用一个人脸检测算法Viola-Jones在不同的web图像集里面检测并扣取出来的。







Olivetti人脸数据集:fetch_olivetti_faces()


rcv1多标签数据集:fetch_rcv1()

还有其他的属性如sample_id,target_names等

Forest covertypes:预测森林表面植被类型的数据集,是个多类分类任务数据集。来自美国的森林数据,UCI数据集。

每个样本包含54个特征,其中含有布尔类型的特征。



计算机生成的数据集
sklearn.datasets.make_

用于分类任务和聚类任务的:这些函数产生样本特征向量矩阵以及对应的类别标签集合




用于回归任务的

用于流行学习的

用于因子分解的

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/341392.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号