Scrapy使用的XPath
1.0具有非常有限的字符串操作功能,尤其是不支持正则表达式。减少字符串有两种方法,我将通过一个示例来演示两种方法,以简化为您要查找的子字符串。
按字符索引
如果字符索引不更改(但内容可以更改),这很好。
substring($string, $start, $len)substring(//td[@]/text(), 16, 16)
通过前置/后缀搜索
如果索引可以更改,这很好,但是字符串前后的内容立即保持不变:
substring-before($string, $needle)substring-after($string, $needle)substring-before( substring-after(//td[@]/text(), 'on '), ' Read')



