·pandas内置了10多种数据源读取函数,常见的就是CSV和Excel ·使用read_csv方法读取,结果为dataframe格式 ·在读取CSV文件时,文件名尽量是英文 ·参数较多,可以自行控制,但很多时候用默认参数 ·在读取CSV时,注意编码,常用编码为utf-8、gbk、gbk2312和gb18030 ·使用to_csv方法快速保存
import os print(os.getcwd()) # 获取当前路径
baby = pd.read_csv('sam_tianchi_mum_baby.csv',encoding='utf-8')
pd.set_option('display.max_columns',50)
pd.set_option('display.max_rows',100)
print(baby)
encoding用于设置字符编码,默认utf-8
set_option(‘display.max_columns’,50) 用于设置显示的最大列数
pd.set_option(‘display.max_rows’,100) 用于设置显示的最大行数
order = pd.read_csv('meal_order_info.csv',encoding='gbk',dtype={'info_id':str,'emp_id':str})
print(order.head(10))
print(order.info())
dtype用于设置字段的数据类型
baby1 = pd.read_csv('baby_trade_history.csv',nrows=100) # 只读取100行
nrows用于限制读取的行数
写入CSV文件
baby1.to_csv('a1.csv',encoding='utf-8',index=False)
index用于表示 是否包含索引



