多线程爬取

Python 更新时间：2026-04-02 10:20:37 发布时间：1440天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

```python
from threading import Thread

from threading import Thread
from fake_useragent import UserAgent
import requests
from time import sleep
from queue import Queue
def spider():
    while not url_queue.empty(): #调用Queue中的empty方法，回传回True 或 False 
        url = url_queue.get()   #调用get方法，得到队列中的目标网站       
        headers = {'User-Agent' : UserAgent().chrome}
        resp = requests.get(url,headers = headers)
        #处理响应结果
        for d in resp.json().get('data'):
            print(f'tid:{d.get("tid")} topic:{d.get("topicName")} content:{d.get("content")}')           
            sleep(3)    
        

if __name__ == '__main__':
    #将目标网站扔进队列
    #目标网站
    url_queue = Queue()
    for i in range (1,11):
        url = f'https://www.hupu.com/home/v1/news?pageNo={i}&pageSize=50'
        url_queue.put(url)
    for i in range(2):    #开启两个线程
        t1 = Thread(target = spider)
        t1.start()    #开启线程

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/822655.html

上一篇 python 对json返回值进行序列化

下一篇农夫过河——python贪心算法实现

Python相关栏目本月热门文章

关于我们文章归档网站地图联系我们