您正在寻找的是:
link = link1.css('span[class=title] a::attr(href)').extract()[0]由于您还匹配了
span“ class”属性,因此您甚至可以编写
link = link1.css('span.title a::attr(href)').extract()[0]请注意,
::text伪元素和
::attr(attributename)功能伪元素 不是 标准的CSS3选择器。它们是Scrapy
0.20中CSS选择器的扩展。
编辑(2017-07-20):从Scrapy 1.0开始,您可以使用
.extract_first()代替
.extract()[0]
link = link1.css('span[class=title] a::attr(href)').extract_first()link = link1.css('span.title a::attr(href)').extract_first()


