一、文件的读取和写入
1.文件读取
df = pd.read_csv(‘my_csv.csv’) #默认可以读取以逗号为分隔符的数据,如csv
df = pd.read_table(‘my_table.txt’)#默认可以读取以空格或者制表符为分隔符的数据,如txt,xls
df = pd.read_excel(‘my_excel.xlsx’)#可以读取xlsx为后缀的文件
参数(共用)
header = None #第一行是否作为列名
index_col = ‘col1’ #设置索引-单列
index_col = [‘col1’,’col2’]#设置索引-多列
usecols = [‘col1’]#读取列的集合
parse_dates#转换为时间的列
nrows=2#读取的行数,此处为2行
sep =分割参数,可以选择分割符号类型,至此所有读取都可以互相转换。‘||||’为||||,’t‘为制表符
#tsv文件是以制表符作为分隔符
2.文件写入
df_csv.to_csv(‘my_csv.csv’,index = False)
df_excel.to_excel(‘my_excel.xlsx’)
df_txt.to_csv(‘my_txt.txt’,sep=’t’,index=False)#读取txt文件,关键在sep=‘t’
参数(共用)
index =False#是否保留索引
sep用途和上面一样
3.特性
df = df[‘col1’]#单括号,格式为Series
df = df[[‘col1’,’col2’]]#双括号,格式为dataframe



