栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Python爬虫-登录新浪微博并获取关注列表

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python爬虫-登录新浪微博并获取关注列表

本人新手,所以采取移动端登录,
首先打开m.weibo.com
接下来输入账户密码登录,进行抓包,这里可以看到登录的url是https://passport.weibo.cn/sso/login

image.png

然后看参数内容,可以看到有username,password


image.png

接下来开始码

param = {    'username': 'username',    'password': 'password',    'savestate': 1,    'r': 'http://m.weibo.cn/'}

url = 'https://passport.weibo.cn/sso/login' url_list = [('https://m.weibo.cn/api/container/getSecond?containerid=1005053295408160_'
             '-_FOLLOWERS&page={}'.format(index)) for index in range(1, 9, 1)]

伪装成浏览器,设置请求头

headers = {        'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,**;q=0.8',        'Accept-Encoding': 'gzip, deflate, br',        'Accept-Language': 'zh-CN,zh;q=0.8',        'Connection': 'keep-alive',        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 '
                      '(KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}

cookie = {    'SUB': '_2A250j7ojDeRhGeVM4lcV8CbNzTyIHXVUc8ZrrDV6PUJbkdBeLRfdkW0BL90qwu2eRETLthwusaALWYW0M..',    'Path': '/',    'Domain': '.weibo.cn',    'Expires': 'Fri, 10 Aug 2018 02:52:35 GMT',    '_T_WM': '455639fc43e99e886ce1d07e795d0b88',    'SCF': 'Aij4zi-OmgzuJPRpOQ3dqpZ-ASMB3LshtNNn-DL4wO0DwTnXeihX4F2uo4youXrual-w4UuBxGTR8UKP4Qq9SL.',    'SUHB': '0P1M9JSHSW7Zo',    'SSOLoginState': '150233355'}

url = 'https://passport.weibo.cn/sso/login'url_list = [('https://m.weibo.cn/api/container/getSecond?containerid=1005053295408160_'
             '-_FOLLOWERS&page={}'.format(index)) for index in range(1, 9, 1)]

param = {    'username': 'your username',    'password': 'your password',    'savestate': 1,    'r': 'http://m.weibo.cn/'}

s = requests.Session()
s.post(url, param, headers)for url_concern in url_list:
    res = requests.get(url=url_concern, cookies=cookie, headers=headers)
    users = res.json()['cards']    for user in users:
        name = user.get('user').get('screen_name')
        print(name)



作者:mocokoo
链接:https://www.jianshu.com/p/202c6d8e59ac


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/221842.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号