栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

【Pytorch常见操作】加载本地数据集

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

【Pytorch常见操作】加载本地数据集

        在线下载数据集太慢了,我们尝试手动下载,自行导入本地数据集,以FashionMnist为例:

       torch.utils.data.Dataset 是一个抽象类,用户想要加载自定义的数据集只需要继承这个类,并且覆写其中的三个方法即可:

        1.__init__:数据集的初始化,加载等;

        2.__getitem__:用于获取一些指定索引的数据,返回数据集中指定位置的样本;

        3.__len__:实现len(dataset),返回整个数据集的大小。

        注意:不覆写这三个方法会直接返回错误。

def __getitem__(self, index):
    raise NotImplementedError
def __len__(self):
    raise NotImplementedError

         建立的自定义类如下:

from torch.utils.data import Dataset
import gzip
import numpy as np
class DealDataset(Dataset):
    """
        读取数据、初始化数据
    """

    def __init__(self, folder, data_name, label_name, transform=None):
        (train_set, train_labels) = load_data(folder, data_name,label_name)  
        self.train_set = train_set
        self.train_labels = train_labels
        self.transform = transform

    def __getitem__(self, index):
        img, target = self.train_set[index], int(self.train_labels[index])
        if self.transform is not None:
            img = self.transform(img)
        return img, target

    def __len__(self):
        return len(self.train_set)


def load_data(data_folder, data_name, label_name):
    with gzip.open(os.path.join(data_folder, label_name), 'rb') as lbpath:  
        y_train = np.frombuffer(lbpath.read(), np.uint8, offset=8)

    with gzip.open(os.path.join(data_folder, data_name), 'rb') as imgpath:
        x_train = np.frombuffer(
            imgpath.read(), np.uint8, offset=16).reshape(len(y_train), 28, 28)
    return (x_train, y_train)

        设计好数据类后,就可以使用torch.utils.data.DataLoader来加载数据集,并访问它了。

trainDataset = DealDataset(r'D:MachineLearningdataFashionMNISTraw\',
                         r'train-images-idx3-ubyte.gz',
                         r'train-labels-idx1-ubyte.gz')

                                                                                                                                                  Over 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/467956.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号