栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

crapy管道以正确的格式导出csv文件

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

crapy管道以正确的格式导出csv文件

我从头开始,下面的spider应该与

scrapy crawl amazon -t csv -o Amazon.csv --loglevel=INFO

因此,使用电子表格打开CSV文件对我来说是

希望这可以帮助 :

import scrapyclass AmazonItem(scrapy.Item):    rating = scrapy.Field()    date = scrapy.Field()    review = scrapy.Field()    link = scrapy.Field()class AmazonSpider(scrapy.Spider):    name = "amazon"    allowed_domains = ['amazon.co.uk']    start_urls = ['http://www.amazon.co.uk/product-reviews/B0042EU3A2/' ]    def parse(self, response):        for sel in response.xpath('//table[@id="productReviews"]//tr/td/div'): item = AmazonItem() item['rating'] = sel.xpath('./div/span/span/span/text()').extract() item['date'] = sel.xpath('./div/span/nobr/text()').extract() item['review'] = sel.xpath('./div[@]/text()').extract() item['link'] = sel.xpath('.//a[contains(.,"Permalink")]/@href').extract() yield item        xpath_Next_Page = './/table[@id="productReviews"]/following::*//span[@]/a[contains(.,"Next")]/@href'        if response.xpath(xpath_Next_Page): url_Next_Page = response.xpath(xpath_Next_Page).extract()[0] request = scrapy.Request(url_Next_Page, callback=self.parse) yield request


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/372052.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号