我将始终将lxml用于此类任务。您也可以使用beautifulsoup。
import lxml.htmlt = lxml.html.parse(url)print t.find(".//title").text根据评论进行编辑:
from urllib2 import urlopenfrom lxml.html import parseurl = "https://www.google.com"page = urlopen(url)p = parse(page)print p.find(".//title").text


