栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

使用Google Cloud Functions时ReactorNotRestartable出现刮擦

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

使用Google Cloud Functions时ReactorNotRestartable出现刮擦

默认情况下,的异步性质

scrapy
无法与Cloud
Functions一起很好地工作,因为我们需要一种阻止爬网的方法,以防止该函数过早返回,并防止该实例在进程终止之前被杀死。

相反,我们可以使用

scrapydo
阻塞方式来运行您现有的蜘蛛:

requirements.txt

scrapydo

main.py

import scrapyimport scrapydoscrapydo.setup()class MyItem(scrapy.Item):    url = scrapy.Field()class MySpider(scrapy.Spider):    name = "example.com"    allowed_domains = ["example.com"]    start_urls = ["http://example.com/"]    def parse(self, response):        yield MyItem(url=response.url)def run_single_crawl(data, context):    results = scrapydo.run_spider(MySpider)

这也显示了一个简单的示例,说明如何

scrapy.Item
从蜘蛛中产生一个或多个并从爬取中收集结果,如果不使用,这也将是一个挑战
scrapydo

另外:请确保您已为项目启用结算。默认情况下,Cloud Functions无法发出出站请求,并且搜寻器将成功执行,但不返回任何结果。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/404589.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号