栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

python数据分析(1) DataFrame常用命令,取自kaggle竞赛

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

python数据分析(1) DataFrame常用命令,取自kaggle竞赛

import pandas as pd
 
# 读取文件
melbourne_file_path = '../input/melbourne-housing-snapshot/melb_data.csv'
melbourne_data = pd.read_csv(melbourne_file_path) 
# 显示列名(用于查看数据结构)
melbourne_data.columns
 
# 删除具有空值的行,一行有一个空值则全部删除
melbourne_data = melbourne_data.dropna(axis=0)
 
# 提取用于数据预测的列,有两种方式
y = melbourne_data.Price
y = melbourne_data['Price']
 
# 一次性提取多个列用于自变量
melbourne_features = ['Rooms', 'Bathroom', 'Landsize', 'Lattitude', 'Longtitude']
X = melbourne_data[melbourne_features]
 
# 对dataframe每一列特征进行描述,如中位数,平均数,有效数据量等
X.describe()
 
# 观察前几行数据
X.head()
 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/856175.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号