栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

读取文件夹根目录写入txt并生成随机样本

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

读取文件夹根目录写入txt并生成随机样本

通过python写一些脚本实现数据处理功能确实很方便,先记录当下,后续补充完善

1.读取文件夹所有数据并进行随机采样

注:主要调用os库的文件操作功能,想要掌握程度就自己实现一个小功能就很快了解其基本原理了,代码书写时需要注意上下对齐与空格,不然会报错,再就是对于中文路径读出和写入时的编码小心,其他就是字符串的操作了,具体实现如下:

# -*- coding:UTF-8 -*-
import os
import random
dirname = "...folder"
txt_path='F:/code/Pycham/list.txt'
txt_file = open(txt_path,'w')
imglist=[]

def traverse_path(file_path):
    files = os.listdir(file_path)
    for fi in files:
        fi_d = os.path.join(file_path, fi)
        if os.path.isdir(fi_d):

            traverse_path(fi_d)
        else:
            img_name=os.path.join(file_path, fi_d)
            #print(img_name)
            if img_name[-4:]=='tiff':
                #print(img_name)
                txt_file.write(img_name)
                txt_file.write('n')
    # for i in len(lists):
    #     print(lists(i))
#print("读取图像数量:",len(imglist))
traverse_path(dirname)

#随机抽取样本数目
sample_file='F:codePychamsample.txt'
n=1000
f=open(txt_path,encoding='gbk')
lines=f.readlines()
list=[]
for line in lines:
    print(line)
    list.append(line)
print("样本总个数:",len(list),"   抽样个数:",n)
g=open(sample_file,'w')
a=random.sample(list,n)#随机抽取n行
for i in a:
    g.write(i)

f.close()
g.close()

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/740012.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号