栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

数据预处理沙盘_数据预处理pandas主要语句?

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

数据预处理沙盘_数据预处理pandas主要语句?

#使用pandas预处理原数据,并将原始数据转换成张量的格式
#pandas软件包是Python中常用的数据分析工具中,pandas可以与张量兼容
#用pandas处理缺失的数据时,我们可根据情况选择用插值法和删除法

import os
os.makedirs(os.path.join('..','data'),exist_ok = True)
data_file = os.path.join('..','data','house_tiny.csv')
with open(data_file,'w') as f:
    f.write('NumRooms,Alley,Pricen')  # 列名
    f.write('NA,Pave,127500n')  # 每行表示一个数据样本
    f.write('2,NA,106000n')
    f.write('4,NA,178100n')
    f.write('NA,NA,140000n')

import pandas as pd

data = pd.read_csv(data_file)
print(data)

inputs,outputs = data.iloc[:,0:2], data.iloc[:,2]
inputs = inputs.fillna(inputs.mean())
print(inputs)

inputs = pd.get_dummies(inputs, dummy_na=True)   #input类别类或者离散类 ,自动将类型划分成两类
print(inputs)

import torch
#当inputs and outputs所有的条目都是数值类型,就可以将其转换成张量格式
x, y = torch.tensor(inputs.values), torch.tensor(outputs.values)
print(x,y)
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/786939.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号