###爬虫入门级
##爬虫入门级(正则匹配数据获取)
主要讲解正则匹配规则,爬虫常用的正则
# %%
####正则表达式
"""
W 匹配非字母或数字或下划线
w 匹配字母或数字或下划线
d 匹配数字
D 匹配非数字
S 匹配非空白符
s 匹配空白符
^ 开始
$ 结束
.* 贪婪匹配
.*? 惰性匹配
* 0次到无数次
+ 1次到无数次
"""
import re
### d+
obj = re.compile(r"d+")
s = "我的电话号是:10086.我女朋友的电话没事100010"
ret = obj.finditer(s)
for i in ret:
print(i.group())
# %%
### .*
s = """
大聪明
大聪明1
大聪明2
大聪明3
大聪明4
"""
obj = re.compile(r"d+)'>(?P.*?)")
ret = obj.finditer(s)
for i in ret:
print(i.group("a"))



