pandas-读取文件（read

可接收以下常用参数：

1. filepath_or_buffer : various

文件路径（path），URL

2. sep : str

默认 read_csv()分隔符为【,】, read_table方法，分隔符为【t】

3. delimiter : str, default None

sep的替代参数.

4. delim_whitespace : boolean, default False

指定是否将空格 (e.g. ' ' or 't')当作delimiter。等价于设置 sep='s+'. 如果这个选项被设置为 True,就不要给 delimiter 传参了.

5. header : int or list of ints, default 'infer'

当选择默认值或header=0时，将首行设为列名。如果列名被传入明确值就令header=None。注意，当header=0时，即使列名被传参也会被覆盖。

输出:

6. names : array-like, default None

列名列表的使用. 如果文件不包含列名，那么应该设置header=None。列名列表中不允许有重复值.

输出：

7. index_col : int, str, sequence of int / str, or False, default None

Dataframe的行索引列表, 既可以是字符串名称也可以是列索引. 如果传入一个字符串序列或者整数序列,那么一定要使用多级索引（MultiIndex）.

注意: 当index_col=False ，pandas不再使用首列作为索引。例如，当你的文件是一个每行末尾都带有一个分割符的格式错误的文件时.

输出：

8. usecols : list-like or callable, default None

返回列名列表的子集. 如果该参数为列表形式, 那么所有元素应全为位置（即文档列中的整数索引）或者全为相应列的列名字符串（这些列名字符串为names参数给出的或者文档的header行内容）.例如，一个有效的列表型参数 usecols 将会是是 [0, 1, 2] 或者 ['foo', 'bar', 'baz'].

输出（使用此参数可以大大加快解析时间并降低内存使用率）：

9. dtype : Type name or dict of column -> type, default None

指定某列或整体数据的数据类型. E.g. {'a': np.float64, 'b': np.int32}.将str或object与合适的设置一起使用以保留和不解释dtype。

输出：

10. skiprows : list-like or integer, default None

Line numbers to skip (0-indexed) or number of lines to skip (int) at the start of the file.

输出：

11. skipfooter : int, default 0

输出：

pandas-读取文件（read

Python相关栏目本月热门文章