栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Python爬取内涵段子里的段子

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python爬取内涵段子里的段子

环境:Python3.6


#!/usr/bin/env python3

#-*-coding:utf-8-*-

#version:3.6.4

__author__ = '杜文涛'

 

import requests

import json

 

 

def get_json_dic(url):

    global dict_json

    response = requests.get(url=url)

    json_response = response.content.decode() #获取r的文本 就是一个json字符串

    dict_json = json.loads(json_response) #  将json字符串转换成dic字典对象

 

    return dict_json

 

def get_joke(dict_json):

    print(len(dict_json['data']['data']))

    for i in range(1,20):

        conture = input('是否继续,Y/N')

        if conture == 'Y' or conture == 'y':

            joke = dict_json['data']['data'][i]['group']['text']

            if i == 19:

                dict_json = {}

                conture

            print(joke)

        else:

            exit()

 

def get_max_time(dic_json):

    global max_time

    max_time = dict_json['data']['max_time']

    return max_time

 

if __name__ == '__main__':

    max_time = 1519404642

    url = 'http://www.neihanshequ.com/joke/?is_json=1&app_name=neihanshequ_web&max_time=' + str(max_time)

 

    get_json_dic(url)

    get_max_time(dic_json=dict_json)

    get_joke(dict_json=dict_json)

 

    while True:

        url = 'http://www.neihanshequ.com/joke/?is_json=1&app_name=neihanshequ_web&max_time=' + str(max_time)

        get_json_dic(url)

        get_max_time(dic_json=dict_json)

        get_joke(dict_json=dict_json)

        print(url)


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/224869.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号