pyquery的CSS选择器用于指定CSS代码,并通过CSS代码选取HTML文档中对应的节点。创建一个CSS选择器需要创建一个PyQuery对象,PyQuery类的构造方法需要传入一个HTML文档(可以是字符串、URL或文件形式)。由于PyQuery类重载了函数调用运算符(实现了__call__函数),所以可以按下面的代码使用PyQuery类的实例。
from pyquery import PyQuery as pq
doc = pq(html)
# 由于PyQuery类重载了函数调用运算符,所以可以像调用函数一样使用PyQuery的实例,函数参数就是CSS代码
result = doc('#button1')
下面的例子用PyQuery对象解析了字符串形式的HTML代码和京东商城首页的HTML代码,并通过CSS选择器提取字符串形式的HTML代码中的节点信息,以及京东商城首页导航条链接的文本。
京东商城导航条的样式如图1所示。我们要提取的就是这一行文本,如“秒杀”、“优惠券”等。



