栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

修改scrapy中的CSV导出

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

修改scrapy中的CSV导出

contrib/feedexport.py

class FeedExporter(object):    ...    def open_spider(self, spider):        file = TemporaryFile(prefix='feed-')        exp = self._get_exporter(file)  # <-- this is where the exporter is instantiated        exp.start_exporting()        self.slots[spider] = SpiderSlot(file, exp)    def _get_exporter(self, *a, **kw):        return self.exporters[self.format](*a, **kw)  # <-- not passed in :(

您将需要自己制作,这是一个示例:

from scrapy.conf import settingsfrom scrapy.contrib.exporter import CsvItemExporterclass CsvOptionRespectingItemExporter(CsvItemExporter):    def __init__(self, *args, **kwargs):        delimiter = settings.get('CSV_DELIMITER', ',')        kwargs['delimiter'] = delimiter        super(CsvOptionRespectingItemExporter, self).__init__(*args, **kwargs)

settings.py
搜寻器目录的文件中,添加以下内容:

FEED_EXPORTERS = {    'csv': 'importable.path.to.CsvOptionRespectingItemExporter',}

现在,您可以按以下方式执行蜘蛛程序:

scrapy crawl spidername --set FEED_URI=output.csv --set FEED_FORMAT=csv --set CSV_DELIMITER=';'

HTH。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/626262.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号