栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

是否有适用于Python的示例数据集?

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

是否有适用于Python的示例数据集?

您可以使用

rpy2
package从Python访问所有R数据集。

设置界面:

>>> from rpy2.robjects import r, pandas2ri>>> def data(name): ...    return pandas2ri.ri2py(r[name])

然后

data()
使用可用数据集的任何数据集名称进行调用(就像中的一样
R

>>> df = data('iris')>>> df.describe()       Sepal.Length  Sepal.Width  Petal.Length  Petal.Widthcount    150.000000   150.000000    150.000000   150.000000mean       5.843333     3.057333      3.758000     1.199333std        0.828066     0.435866      1.765298     0.762238min        4.300000     2.000000      1.000000     0.10000025%        5.100000     2.800000      1.600000     0.30000050%        5.800000     3.000000      4.350000     1.30000075%        6.400000     3.300000      5.100000     1.800000max        7.900000     4.400000      6.900000     2.500000

要查看可用数据集的列表以及每个数据集的描述,请执行以下操作:

>>> print(r.data())

注意:rpy2需要

R
使用设置
R_HOME
变量
pandas
进行安装,并且也必须安装。

更新:

我刚刚创建了PyDataset,这是一个简单的模块,可以使从Python加载数据集的操作与一样简单

R
(并且不需要
R
安装,只需
pandas
)。

要开始使用它,请安装模块:

$ pip install pydataset

然后只需加载您想要的任何数据集(当前大约有757个数据集):

from pydataset import datatitanic = data('titanic')


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/623779.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号