怎么用python读取csv文件,并且是读取列_python中怎么读取csv文件?

python操作csv文件命令大全（一）读文件和看文件

df = pd.read_csv（'文件名.csv'）
df.head()  #默认前五行，若是想看更多行，括号里自行输入

合并文件

pd.merge(left, right, how=' ', on=None, left_on=None, right_on=None,
         left_index=False, right_index=False, sort=True,
         suffixes=('_x', '_y'), copy=True, indicator=False,
         validate=None)

各参数如下：

left: 拼接的左侧Dataframe对象right: 拼接的右侧Dataframe对象on: 要加入列或索引的名称，名称必须在两个Dataframe对象中都能找到，因为是根据该名称就行合并。（如果未传递且left_index和right_index为False，则Dataframe中的列的交集将被推断为连接键）。left_on:左侧Dataframe中的列或索引级别用作键。可以是列名，索引级名称，也可以是长度等于Dataframe长度的数组。right_on: 左侧Dataframe中的列或索引级别用作键。可以是列名，索引级名称，也可以是长度等于Dataframe长度的数组。left_index: 如果为True，则使用左侧Dataframe中的索引（行标签）作为其连接键。
对于具有MultiIndex（分层）的Dataframe，级别数必须与右侧Dataframe中的连接键数相匹配。right_index: 与left_index功能相似。how: One of ‘left’, ‘right’, ‘outer’, ‘inner’.默认inner。inner是取交集，outer取并集，left为左连接，right为右连接，标签不能对齐的部分，用NAN进行填充。sort: 按字典顺序通过连接键对结果Dataframe进行排序。默认为True，设置为False将在很多情况下显着提高性能。suffixes: 用于重叠列的字符串后缀元组。默认为（‘x’，’ y’）。copy: 始终从传递的Dataframe对象复制数据（默认为True），即使不需要重建索引也是如此。indicator:在pd.concat()中可以通过参数设定显示拼接后的表中哪些信息来自于哪一个表格，在pd.merge()中也可以进行这样的操作，就是通过indicator参数设置，默认是False不显示数据来源，把参数设置为True就可以了。
例子：

dff = all_data.merge(df,on = 'start_id',how = 'left')

左连接保留左表的信息，把右表中主键与左表一致的信息拼接进来，标签不能对齐的部分，用NAN进行填充。

文件保存为csv 保存路径

df.to_csv('text.csv') #相对位置，保存在getwcd()获得的路径下
df.to_csv('C:/Users/name/Desktop/text.csv') #绝对位置

查询当前工作路径

import os
os.getcwd() #获取当前工作路径

分隔符

df.to_csv('text.csv',sep='?')#使用?分隔需要保存的数据，不写则默认是

替换空值

df.to_csv('text.csv'，,na_rep='NAN')#缺失值保存为NAN，如果不写，默认是空

保存格式

df.to_csv('text.csv',,float_format='%.2f')#保留两位小数

是否保留列名

df.to_csv('text.csv',header=0) #不保存列名

是否保留行索引

df.to_csv('text.csv',index=0) #不保存行索引

计算列中各元素的数量

df=模块名.groupby(['列名']).size().reset_index(name='weight')

给每列重命名，并输出某列

df.columns = ['A','B','C','D','E']  #‘填重命的列名’，有几列就要命名几列
df.drop(columns=['B'])   #删除B列

怎么用python读取csv文件,并且是读取列_python中怎么读取csv文件?

Python相关栏目本月热门文章