栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

【数据分析上手实践】读取数据

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

【数据分析上手实践】读取数据

2022/3/15

1.导入两个库

Numpy计算

Pandas 开源用于数据分析的工具

import numpy as np

import pandas as pd

import os  #用于os.getcwd()查找文件路径

2.使用相对/绝对路径导入数据

相对:

pd.read_csv #将csv文件读入并转化为数据框形式

#return dataframe or textparser

df=pd.read_csv('C:\Users\71403\Desktop\titanic\train.csv')  #df 选取

#这里一直报错

#AttributeError:函数名写错

#SyntaxError:语法错误-打成中文字符

#osError:文件路径的格式出错

#permission denied:右键属性开启权限/xx计算机名/user

#filednotfound:cvs文件和代码放一个文件夹

df.shape  #显示(行,列)

df.head()  #显示dataframe数据框的头部

df.tail(3)  #尾部数据

#df.index 显示索引

#df.columns 显示列名

3.pd.read_table(path) #以行为单位存储,没有分割

pd.read_csv  #用逗号进行分割

#如何让read_table &read_csv表的形式一致?

Pd.read_table(path,sep=’,’)  #限定分割符以逗号分割

4.逐块读取数据

df=Pd.read_csv(‘train.csv’,chunksize=1000) #以每一千行为一块

df.head()

这里类型已经变了,故报错

Type(df)

Df.get_chunk()

5.将表头改为中文

方法一:表头替换

#先取消分块

Df=pd.read_csv(‘train.csv’)

Df.column=(‘’,’’,’’,…)

Df

#方法二 读取文件时直接重新命名/多加表头

Df=pd.read_csv(‘train.csv’,name=[‘’,’’,’’,…])

Df

6.展示头部及尾部数据

Df.tail()

Df.tail(15).shape  #显示行列

Df.head(10)  #显示前九行数据

7.显示空值数据

Df.isnull()

8.df.to_csv(‘train_chinese.csv’)

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/768760.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号