假设
id属性值始终采用格式,
UID_后跟一个或多个字母数字字符,
-SRC_后跟一个或多个数字:
import refrom bs4 import BeautifulSoupsoup = BeautifulSoup(html)pattern = re.compile(r"UID_(w+)-SRC_d+")id = soup.find("div", id=pattern)["id"]uid = pattern.match(id).group(1)print(uid)在这里,我们使用
BeautifulSoup并搜索
id与特定正则表达式匹配的属性值。它包含一个保存组
(w+),可帮助我们提取UID值。



