栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

python 获取网页特定图片并保存至本地

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

python 获取网页特定图片并保存至本地

一般步骤

1.查看网页地址,F2查看要获取的图片url

2.根据要获取的url图片地址,写出合适的正则表达式

例:获取页面中如下区域图片:https://blog.csdn.net/julielele?spm=3001.5343

 F12查看图片链接

 获得正则表达式:

format = r'src="https://www.mshxw.com/skin/sinaskin/image/nopic.gif" alt'

代码示例

import os
import re,urllib.request
import time

def getImage(format,url,filePath):
    '''
    :param format: 匹配的正则表达式
    :param url: 获取图片的网址
    :param filePath: 获取的图片存入的文件夹
    :return:
    '''
    request = urllib.request.urlopen(url)
    buf = request.read().decode('utf-8')
    # 获取符合条件的图片链接
    listurl = re.findall(format,buf)
    print(listurl)
    #筛选拼接图片链接
    res=[]
    for url in listurl:
         res.append(url+".png")
    timestr = time.strftime("%Y-%m-%d-%H-%M-%S",time.localtime())
    path = filePath+"img"+timestr+"\"
    isExists=os.path.exists(path)
    if not isExists: os.makedirs(path)
    index = 0
    for url in res:
        print(url)
        try:
            f = open(path+str(index)+'.png', 'wb')
            request = urllib.request.urlopen(url)
            buf = request.read()
            f.write(buf)
            index = index + 1
        except Exception:
            continue
        finally:
            #关闭文件
            f.close()

url = "https://blog.csdn.net/julielele?spm=3001.5343"
#匹配截取开头的url('结尾的.png后的数据
# format = r'url('(.*).png'
format = r'src="https://www.mshxw.com/skin/sinaskin/image/nopic.gif" alt'
filePath = "d:img"
getImage(format,url,filePath)

运行后结果:

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/503848.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号