os.makedirs(os.path.join( .. , data ), exist_ok True) # 创建数据文件夹
data_file os.path.join( .. , data , house_tiny.csv )
with open(data_file, w , encoding utf-8 ) as f:
f.write( NumRooms, Alley, Pricen ) # 列名
f.write( NA, Pave, 127500n ) # 样本
f.write( 2, NA, 106000n ) # 样本
f.write( 4, NA, 178100n ) # 样本
f.write( NA, NA, 140000n ) # 样本
数据的加载
import pandas as pd
data pd.read_csv(data_file)
空值处理 数字列
inputs, outputs data.iloc[:, 0:2], data.iloc[:,2]
print(inputs)
means inputs.mean(axis 0, numeric_only True)
inputs inputs.fillna(means)
print(inputs)
print(means)
空值处理 非数字
inputs pd.get_dummies(inputs, dummy_na False)
print(inputs)
数据转换为torch
import torch
x, y torch.tensor(inputs.values, dtype torch.float32),torch.tensor(outputs.values)