栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

selenium与scrapy的动态页面

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

selenium与scrapy的动态页面

这实际上取决于你需要如何刮取网站以及你希望如何以及要获取什么数据。

这是一个示例,你可以使用

Scrapy
+ 跟踪eBay上的分页
Selenium

import scrapyfrom selenium import webdriverclass ProductSpider(scrapy.Spider):    name = "product_spider"    allowed_domains = ['ebay.com']    start_urls = ['http://www.ebay.com/sch/i.html?_odkw=books&_osacat=0&_trksid=p2045573.m570.l1313.TR0.TRC0.Xpython&_nkw=python&_sacat=0&_from=R40']    def __init__(self):        self.driver = webdriver.Firefox()    def parse(self, response):        self.driver.get(response.url)        while True: next = self.driver.find_element_by_xpath('//td[@]/a') try:     next.click()     # get the data and write it to scrapy items except:     break        self.driver.close()

除了必须与结合使用之外

Selenium
,还有另一种选择
Scrapy



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/370211.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号