栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

python爬虫获取表情包 助你成为群里最靓的仔

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

python爬虫获取表情包 助你成为群里最靓的仔

环境准备 python3.9.7 pycharm pip install request pip install re 首先向目标网址模拟发送Get请求
import requests
import re

url = f"https://fabiaoqing.com/biaoqing/lists/page/{pages}.html"
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240."
                  "198 Safari/537.36"
}
response = requests.get(url=url, headers=headers)
利用re正则表达式挑选想要的 url 和 Title
images = re.findall('
最后for循环一下利用re.sub替换掉异常字符然后保存数据

for img_url, title in zip(images, title):
    sk = img_url
    if len(title) < 50:
        new_title = re.sub(r'[ \/:*"?|<>]', '', title)
        response_2 = requests.get(img_url).content
        suffix = img_url.split('.')[-1]
        with open(f'img\{new_title}.{suffix}', mode='wb')as f:
            f.write(response_2)
        print(new_title, sk)
最后附上图片可以爬取下来,有兴趣的可以试一试,最后记得关注一下UP主,制作不易,蟹蟹支持

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/303445.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号