- 可以看到原始的数据集中表格里的时间数据是字符串的类型
- 将字符串类型的时间数据转化为时间类型
- pd.to_datetime(sec_cars['Boarding_time'],format = '%Y年%m月',errors = 'coerce')
- 可以看到Sec_price的数据是浮点类型,那如果希望New_price的数据也是浮点型的呢
- 首先查看一下New_price的数据还有没有其他不同xx万类型的字符
- 还真有,‘暂无’表示的是数据的缺失,那我们就要把‘暂无’当成缺失值来处理
- sec_cars = pd.read_csv('sec_cars.csv',na_values = '暂无')
- 参数,na_values= ‘暂无’表示把暂无当作缺失值
- 没有了不同的字符数据后,将‘万’字去掉,只留下数据,再进行类型的转换
- sec_cars['New_price'].str[:-1].astype('float')
3、将表格里的某些字符串类型的值替换为其他字符
- 可以看到原始数据集中Discharge中的数据有‘—’的字符
- 希望可以把‘—’替换为‘缺失值’
- sec_cars['Discharge'] = sec_cars['Discharge'].str.replace('--','缺失值')
4、查看基本统计量
- sec_cars.describe() ,针对数值类型的数据进行统计
- sec_cars.describe(include = ['object']),针对字符类型的数据进行统计
5、计算时间戳



