实用工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询中国历史 Excel函数模拟请求 json格式化

栏目分类:

子分类:

名师互学网

名师互学网用户登录

快速导航

当前搜索

当前分类

前沿技术软件开发系统运维产品运营生活办公面试经验考试题库

实用工具

学习工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询亲戚关系计算安全期计算中国历史 Excel函数模拟请求 json格式化浏览器指纹

名师互学网 > IT > 软件开发 > 后端开发 > Python

Python小记正则

Python 更新时间：2026-05-30 06:01:34 发布时间：1662天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

文章目录

修饰符 / 模式
特别字符
特殊表达式
re模块函数
- compile()
- search()
- match()
- findall()
- split()
- sub() 和 subn()
- sub 高级用法
- finditer()
贪婪匹配
macth 一些出现场景
- group()
- groups()
- groupdict()

修饰符 / 模式

修饰符	描述
re.I	匹配对大小写不敏感
re.L	做本地化识别匹配
re.M	多行匹配，影响^和&
re.S	使.包括换行在内的所有字符
re.U	根据Unicode字符集解析字符。影响 w， W， b， B
re.X	该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

特别字符

字符	说明
$	匹配结尾
^	匹配开头
+	此前表达式一次或多次
?	此前表达式零次或一次
*	此前表达式零次或多次
.	匹配任意字符，除换行
\|	两项之间取或。 a\|b ：表示匹配 a 或 b
	转义字符。要匹配$表达式应为 $
()	子表达式、组
{}	限定符

b	匹配一个边界
B	匹配一个非边界
w	匹配字母和数字
W	匹配非字母和数字
d	匹配数字
D	匹配非数字
s	匹配空白。[tnrfv]
S	匹配非空。

A	匹配字符串的开始
Z	匹配字符串的结束，如有换行，只匹配到换行前的结束字符【常用】
z	匹配字符串结束
G	匹配最后匹配完成的位置

特殊表达式

表达式	说明	示例
(?#…)	注释
[…]	字符组。	[a-zA-z]：匹配字母 [hdjr]：匹配h,d, j 或 r [u4e00-u9fa5]：匹配中文
[^…]	不在字符组的字符。	[^abc]：匹配除了a, b, c外的
{n[, m]}	匹配n次（或n~m次）	6{6,8}：匹配'6'6~8次
a \| b	或	a\|b：匹配 a 或 b
(re)	匹配括号内的表达式，也表示一个组	(http)://：匹配http
(?P…)	命名组
(?P=name)	调用已匹配的命名组
/number	通过序号调用已匹配的组
(?:re)	类似(re),但不表示组
(?imx:re)	在括号中使用 i，m，x可选标志
(?-imx:re)	在括号中不使用 i， m，x可选标志

手机端显示这个表格肯定辣眼睛，截个图放这。

re模块函数

compile()

将正则语句编译成Pattern对选
返回值： Pattern 对象

语法：

pt = re.compile(
	soucre,
	filename,
	mode[, flags[, dont_inherit]]
	)

参数：

source ：字符串或AST对象
filename：代码文件名（如果从文件读取代码的话
mode：编译代码的种类，可为 exec，eval，single

pt = re.compile(r'[aeiou]+$')
pt.findall('hello world')

search()

返回值：第一个成功的匹配(match对象) 或 None

语法：

re.search(
	pattern, 
	string,
	flags=0
)

参数：

pattern：模板
string：待匹配字符串
flags：标志位【是否区分大小写、多行匹配…】

>>> re.search(r'hello', 'hello world')

match对象：

.group() 返回匹配值
.groups()
.groupdict()
.span() 返回匹配位置
.start()
.end()

match()

从第一个字符开始匹配

返回值： match对象或 None

re.match(
	pattern, 
	string,
	flags=0
)

参数：

pattern：模板
string：待匹配字符串
flags：标志位【是否区分大小写、多行匹配…】

match对象：

.group() 返回匹配值
.groups()
.groupdict()
.span() 返回匹配位置
.start()
.end()

findall()

返回值：所有匹配结果列表或元组（有组的话）

语法：

re.findall(
	pattern,
	string,
	flags=0
	)

参数：

pattern：模板
string：待匹配字符串
flags：标志位【是否区分大小写、多行匹配…】

>>> re.findall('hellod?', 'e hello2 world hello1')
['hello2', 'hello1']

split()

将字符串按正则规则切分
返回值：返回分隔后的列表

语法：

re.split(
	pattern,
	string,
	maxsplit=0,
	falgs=0
	)

参数：

pattern：模板
string：待匹配字符串
maxsplit：最大分割数
flags：标志位【是否区分大小写、多行匹配…】

print(re.split(
	r'd{2,4}', 
	'hello2future666HHHHHH897LLL12beloved')
	)
# Output
'''
['hello2future', 'HHHHHH', 'LLL', 'beloved']
'''

sub() 和 subn()

搜索和替换
返回值：替换后的字符串 | subn: (替换后字符串，替换次数)

语法：

re.sub(
	pattern,
	repl,
	string[, count]
	)

参数：

pattern：匹配模板
repl：替换模板。可以是函数
string：原字符串
count：最大替换次数

print(re.sub('666', '999', '祝你666， 祝他666'))
print(re.subn('666', '999', '祝你666， 祝他666'))
# Output
'''
祝你999， 祝他999
('祝你999， 祝他999', 2)
'''

sub 高级用法

def ch(value):
    return str(len(value.group()))

print(re.sub(
	'[hH]+', # pattern
	ch, 	 # repl
	'hhhhhhhh, IamGreat, HHHHH, ni666, hhhhhhh'))
# Output
'''
8, IamGreat, 5, ni666, 7
'''

finditer()

跟findall类似

返回值： iterator 类。每个元素是一个 match 对象

语法：

re.finditer(pattern,string,flags=0)

贪婪匹配

正则匹配默认为贪婪模式：

st = 'Python ython thon hon on'
pt = re.compile(r'P.+n')
print(pt.findall(st))
# Output
'''
['Python ython thon hon on']
'''
# 并不是匹配到 Python 就结束

非贪婪
‘数量’ 后边加个问号?
‘数量’：+，* 等

st = 'Python ython thon hon on'
pt = re.compile(r'P.+?n')
print(pt.findall(st))
# Output
'''
['Python']
'''

macth 一些出现场景

方法、属性：

group()
groups()
groupdict()
span()
start()
end()

group()

只有一个组，取值时：match.group(0)
span: 匹配到的位置信息

string = 'hello world, hello python'
pt = re.compile(r'hello')
result = pt.search(string)
print(result,		 # 
      result.span(), # (0, 5)
      result.start(),# 0
      result.end(),  # 5
      result.group(),# hello
      sep='n'
      )
# Output
'''

(0, 5)
0
5
hello
'''

groups()

有多个组
想要看按组匹配的结构还得 match.groups()

string = 'hello world, hello python'
result = re.search(
    r'(ello).+(thon)',
    string
)
print(result,
      result.span(),   # (1, 25)
      result.start(),  # 1
      result.end(),    # 25
      result.groups(), # ('ello', 'thon')
      sep='n'
      )
# Output
'''

(1, 25)
1
25
('ello', 'thon')
'''

groupdict()

当给组命名时，可以用groupdict()返回字典
或者也可以用 groups()返回元组

string = 'hello world, hello python'
result = re.search(
    r'(?Pello).+(?Pthon)',
    string
)
print(result,
      result.span(),   # (1, 25)
      result.start(),  # 1
      result.end(),    # 25
      result.groups(), # ('ello', 'thon')
      result.groupdict(),# {'halou': 'ello', 'Py': 'thon'}
      sep='n'
      )
# Output
'''

(1, 25)
1
25
('ello', 'thon')
{'halou': 'ello', 'Py': 'thon'}
'''

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/444472.html

上一篇使用lxml.etree配合Xpath快速爬取100项网页关键词

下一篇 2020年“泰迪杯”数据分析职业技能大赛A题：教育平台的线上课程智能推荐策略

Python相关栏目本月热门文章

热门相关搜索

路由器设置木托盘宝塔面板儿童python教程心情低落朋友圈 vim 双一流学科专升本我的学校日记学校西点培训学校汽修学校情书化妆学校塔沟武校异形模板西南大学排名最精辟人生短句 6步教你追回被骗的钱南昌大学排名清朝十二帝北京印刷学院排名北方工业大学排名北京航空航天大学排名首都经济贸易大学排名中国传媒大学排名首都师范大学排名中国地质大学(北京)排名北京信息科技大学排名中央民族大学排名北京舞蹈学院排名北京电影学院排名中国戏曲学院排名河北政法职业学院排名河北经贸大学排名天津中德应用技术大学排名天津医学高等专科学校排名天津美术学院排名天津音乐学院排名天津工业大学排名北京工业大学耿丹学院排名北京警察学院排名天津科技大学排名北京邮电大学(宏福校区)排名北京网络职业学院排名北京大学医学部排名河北科技大学排名河北地质大学排名河北体育学院排名

关于我们文章归档网站地图联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号：晋ICP备2021003244-6号