栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

pandas-读取文件(read

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

pandas-读取文件(read

可接收以下常用参数:

1. filepath_or_buffer : various

文件路径(path),URL

2. sep : str 

 默认 read_csv()分隔符为【,】, read_table方法,分隔符为 【t】

 

3. delimiter : str, default None

        sep的替代参数.

4. delim_whitespace : boolean, default False

指定是否将空格 (e.g. ' ' or 't')当作delimiter。 等价于设置 sep='s+'. 如果这个选项被设置为 True,就不要给 delimiter 传参了.

5. header : int or list of ints, default 'infer' 

当选择默认值或header=0时,将首行设为列名。如果列名被传入明确值就令header=None。注意,当header=0时,即使列名被传参也会被覆盖。

输出: 

 6. names : array-like, default None

列名列表的使用. 如果文件不包含列名,那么应该设置header=None。 列名列表中不允许有重复值.

 输出:

 7. index_col : int, str, sequence of int / str, or False, default None

Dataframe的行索引列表, 既可以是字符串名称也可以是列索引. 如果传入一个字符串序列或者整数序列,那么一定要使用多级索引(MultiIndex).

注意: 当index_col=False ,pandas不再使用首列作为索引。例如, 当你的文件是一个每行末尾都带有一个分割符的格式错误的文件时.

 输出:

 8. usecols : list-like or callable, default None

返回列名列表的子集. 如果该参数为列表形式, 那么所有元素应全为位置(即文档列中的整数索引)或者 全为相应列的列名字符串(这些列名字符串为names参数给出的或者文档的header行内容).例如,一个有效的列表型参数 usecols 将会是是 [0, 1, 2] 或者 ['foo', 'bar', 'baz'].

 输出(使用此参数可以大大加快解析时间并降低内存使用率):

 9. dtype : Type name or dict of column -> type, default None

指定某列或整体数据的数据类型. E.g. {'a': np.float64, 'b': np.int32}.将strobject与合适的设置一起使用以保留和不解释dtype。

输出:

 10. skiprows : list-like or integer, default None

Line numbers to skip (0-indexed) or number of lines to skip (int) at the start of the file.

输出:

 11. skipfooter : int, default 0

 输出:

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/348418.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号