栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

批量解压ImageNet ISLVRC2012数据集的下载并按标准布局解压

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

批量解压ImageNet ISLVRC2012数据集的下载并按标准布局解压

ImageNet ISLVRC2012的下载并按标准布局解压

最近在github中扒寻大佬代码,准备进行复现,发现很多都使用了imagenet这个数据集。之前因为数据集较为庞大,且下载困难(需要使用学校邮箱账户注册申请下载,且在外网),便一直没有使用,这次下定决心迈过这个坎决定处理一下这个数据集。


好在网络的发达,有大佬将数据集存入了迅雷,并无私的将资源奉献了出来

文章目录
  • ImageNet ISLVRC2012的下载并按标准布局解压
  • 前言
  • 一、ImageNet ISLVRC2012的下载
  • 二、解压步骤
    • 1.布局要求
    • 2.数据集解压
      • (1)解压训练集
      • (1)解压验证集
  • 总结


前言

因为我使用的系统是windows,找到的解压命令很多都linux系统中的,为了能在windows系统下使用,因此下载Git这个软件,在其中的Git Bash中使用以下命令,因为Git Bash集成了很多linux的命令,方便我们的使用。
Git如图所示,第一个就是Git Bash。


提示:以下是本篇文章正文内容,下面案例可供参考

一、ImageNet ISLVRC2012的下载

ImageNet ISLVRC2012的下载
以下两个链接为迅雷链接,复制打开迅雷后就可下载,因为数据集较大(训练集+验证集有144G),下载需要大量时间。

训练集:
http://academictorrents.com/download/a306397ccf9c2ead27155983c254227c0fd938e2.torrent
验证集
http://academictorrents.com/download/5d6d0df7ed81efd49ca99ea4737e0ae5e3a5f2e5.torrent

二、解压步骤 1.布局要求

论文中要求的解压格式如下显示:

要求的标准布局如下:

/path/to/imagenet/
  train/
    class1/
      img1.jpeg
    class2/
      img2.jpeg
  val/
    class1/
      img3.jpeg
    class2/
      img4.jpeg

直接解压的话往往是各个类的图片混合在一起在一个文件夹下,因为有百万张图片之巨,单纯的用人工进行分类无异于是天方夜谭。

2.数据集解压

将下载的数据集压缩包放置在同一文件夹下:

(1)解压训练集

在这个文件夹下右击,点击Git Bash Here:

打开的Git Bash Here窗口显示如图:

将以下命令输入到窗口中:

mkdir train && mv ILSVRC2012_img_train.tar train/ && cd train
tar -xvf ILSVRC2012_img_train.tar && rm -f ILSVRC2012_img_train.tar
find . -name "*.tar" | while read NAME ; do mkdir -p "${NAME%.tar}"; tar -xvf "${NAME}" -C "${NAME%.tar}"; rm -f "${NAME}"; done
cd ..

三行命令逐行输入进Git Bash Here窗口中。

解压后的图片按类保存在每个单独文件夹中

(1)解压验证集

与解压训练集相同,使用以下命令。

wget https://raw.githubusercontent.com/soumith/imagenetloader.torch/master/valprep.sh

mkdir val && tar -xvf ILSVRC2012_img_val.tar -C val && mv valprep.sh val && cd val && bash valprep.sh

由于第一行要下载的valprep.sh文件在外网(valprep.sh文件中保存的就是图片按类生成文件夹的布局),很难下载,因此我在这里上传了迅雷链接,将下载后的文件放入和验证集压缩包同一文件夹下,这样直接在Git Bash Here窗口使用第二个命令就可以完成解压。

链接:https://pan.xunlei.com/s/VMkus56ePQ4LMJUIXheBkhXSA1 提取码:k9ej

解压后的测试集如图所示:


总结

https://www.cnblogs.com/luruiyuan/p/12373328.html

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/283430.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号