如何删除Scrapy Spider数据中的空白

面试问答更新时间：2026-05-21 19:04:41 发布时间：1662天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

事实证明，数据中还存在许多空格，因此结合Steven的回答和更多研究后，数据就可以删除所有标记，行返回和重复的空格。工作代码如下。请注意，在加载程序行上添加了text（），它删除了标记，并且split and join处理器删除了空格和行返回。

def parse(self, response):        items = []        l = XPathItemLoader(item=Greenhouse(), response=response)        l.default_input_processor = MapCompose(lambda v: v.split(), replace_escape_chars)        l.default_output_processor = Join()        l.add_xpath('title', '//h1/text()')        l.add_xpath('usage', '//li[@id="ctl18_ctl00_rptProductAttributes_ctl00_liItem"]/text()')        l.add_xpath('repeat', '//li[@id="ctl18_ctl00_rptProductAttributes_ctl02_liItem"]/text()')        l.add_xpath('direction', '//li[@id="ctl18_ctl00_rptProductAttributes_ctl03_liItem"]/text()')        items.append(l.load_item())        return items

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/377774.html

上一篇带子项的XPath文本

下一篇 Java 字符串是不可变的。到底是什么意思？

面试问答相关栏目本月热门文章

关于我们文章归档网站地图联系我们