栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Python 刷今日头条阅读量

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python 刷今日头条阅读量

因为一直在爬今日头条的数据

在下午的时候,爬着爬着就不小心萌发出了刷今日头条文章阅读量的想法,该文章只适合技术交流,并不做商业用途

也许爬过今日头条的战友们都知道,今日头条的_signature 一直不知道怎么获取,当然,我也是苦恼了一阵,但是后面还是把这个_signature这个值是从哪里取得的知晓了,但是,这个值的获取的文件用了7000行代码,算法那一块也是无从下手。emmm...... 扯远了,回归正题吧。

该教程只适合新手,大牛就不用继续往下看了

方法原理很简单,直接用了selenium+webdriver 这两个库

下面贴上代码:

import timeimport requestsfrom selenium import webdriverdef refresh_html(jianshu_url):
    chromedriver = "C:Program Files (x86)Googlechromedriver_win32chromedriver.exe"
    browser = webdriver.Chrome(chromedriver)
    browser.get(jianshu_url)    while True:
        time.sleep(1)
        browser.refresh()if __name__ == '__main__':
        url = 'https://www.toutiao.com/i6482646112527188494/'
        try:
            refresh_html(url)        except:
            refresh_html(url)

刷之前:

image.png

刷之后:

image.png

注意一点

今日头条访问次数多的情况下对IP进行验证码验证的情况。



作者:徐代龙
链接:https://www.jianshu.com/p/aa94d777110f

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/222469.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号