栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

day1: python爬虫获取美女妹子写真图片

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

day1: python爬虫获取美女妹子写真图片

我的新书《Android App开发入门与实战》已于2020年8月由人民邮电出版社出版,欢迎购买。点击进入详情

文章目录
  • 1.环境
  • 2.编码
    • 1.分析url格式
    • 2.分析图片格式
    • 3.保存图片到本地
    • 4.输入页数
    • 5.效果
  • 3. Github源码

1.环境
  1. IDE: PyCharm 2021.2.1 (Professional Edition)
  2. Python: 3.9.7
2.编码 1.分析url格式

我们随便找一个看妹子图片的网站,看到第一页的格式是https://xxx/index.html,后面页面的格式是https://xxx/index_{N}.html。
我们需要针对这两种情况组装对应的url。

2.分析图片格式

我们通过chrome的查看网页源代码,可以看到图片的格式:


cos 白发美女 4k高清壁纸

那我们可以通过正则表达式将图片的src的值过滤出来:

reg = r'src="https://www.mshxw.com/skin/sinaskin/image/nopic.gif" alt='
imgreg = re.compile(reg)
imglist = imgreg.findall(requesthtml)
3.保存图片到本地
urllib.request.urlretrieve

这个函数可以将图片保存在本地,它有两个参数,第一个是图片url,第二个是本地路径。
图片url就是我们上面回去到的src里面的值,外加前面网站域名。
本地路径我们可以通过下面的方法创建:

	path = 'C:\meinv'
    if not os.path.isdir(path):
        os.makedirs(path)
    paths = path + '\'
4.输入页数

我们可以通过下面的代码在用户运行python的时候让用户自己输入想要下载哪些页的妹纸图片:

pages = int(input("请输入总页数:"))
5.效果

3. Github源码

python爬虫获取美女妹子写真图片

欢迎关注我的技术公众号:国民程序员,我们的目标:输出干货

  1. 每天分享原创技术文章
  2. 海量免费技术资料和视频学习资源
  3. 分享赚钱门道,带领程序员走向财务自由
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/308410.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号