栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

网络爬虫——pandas

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

网络爬虫——pandas

import pandas as pd

df=pd.read_csv('123.csv')
# print(df)

#删除空值
# df2=df.dropna()
# print(df2)

#判断空值
# print(df['NUM_BEDROOMS'].isnull())

#指定空值类型
# missing_values = ["n/a","na","--","NaN"]
# df=pd.read_csv('123.csv',na_values=missing_values)
# # df.dropna(inplace=True)
# #判断某几列
# df.dropna(subset=['ST_NUM'], inplace = True)
# print(df)

#指定空值类型
missing_values = ["n/a","na","--","NaN"]
df=pd.read_csv('123.csv',na_values=missing_values)
#替换空值类型
# df.fillna(123456,inplace=True)
# print(df)
#填充某一列
# df['ST_NUM'].fillna('66666',inplace=True)
# print(df)
#平均数,中位数,众数替换
avg=df['ST_NUM'].mean()
med=df['ST_NUM'].median()
df['ST_NUM'].fillna(avg,inplace=True)
print(df)
import pandas as pd

data = {
    "Date": ['2020/12/01', '2020/12/02' , '20201226'],
    "duration": [50, 40, 45]
}
df = pd.DataFrame(data, index = ["day1", "day2", "day3"])
print(df)

#修改日期数据列,替换原来的数列
df['Date'] = pd.to_datetime(df['Date'])
print(df)

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/850419.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号