Python re.sub 反向引用的实现-巨人网络通讯

Python re.sub 反向引用的实现

match 分组

Python re 模块中提供了 match 函数，用来匹配字符串中指定的正则表达式规则。例如，如果想匹配到 "Isaac Newton, physicist" 中的 Isaac Newton，则可以使用正则表达式 \w+ \w+ ，运行结果如下：

>>> m = re.match("\w+ \w+", "Isaac Newton, physicist")
>>> m
re.Match object; span=(0, 12), match='Isaac Newton'>

re.match 的第一个参数是指定的正则表达式规则，第二个参数是待匹配的字符串。正则表达式规则 \w+ 表示匹配一段连续的字符，要求匹配到的字符数量大于 1。 \w+ \w+ 就表示匹配两段连续的字符，且两段字符中间用空格隔开

使用 match 执行匹配时会对匹配到的结果进行分组，可以通过 match 返回结果的 group() 接口查看分组结果

>>> m.group(0)
'Isaac Newton'

默认情况下， match 只会产生一个分组，就是第 0 个分组，表示整个匹配到的内容。对于上面的例子，第 0 个分组就是 \w+ \w+ 匹配到的完整的内容，也就是 Issac Newton 。
使用正则表达式中的括号 () 可以手动指定匹配的分组。例如如果想把 Issac 和 Newton 做为两个分组，那么可以将正则表达式改为 (\w+) (\w+) ：

>>> m = re.match("(\w+) (\w+)", "Isaac Newton, physicist")

在 (\w+) (\w+) 这个正则表达式中，指定了两个分组，这两个分组匹配的内容都是 \w+ ，并且两个分组之间用空格隔开。
使用 groups() 可以查看匹配结果中的所有分组：

>>> m.groups()
('Isaac', 'Newton')

也可以使用 group() 接口分别查看每一个分组，其中 group(0) 仍然表示完整的匹配结果， group(1) 表示匹配结果中的第 1 个分组， group(2) 表示第 2 个分组，以此类推：

>>> m.group(0)
'Isaac Newton'
>>> m.group(1)
'Isaac'
>>> m.group(2)
'Newton'

re.sub 匹配和替换

re.match() 函数提供了正则表达式的匹配接口， re.sub() 不光能匹配正则表达式，还能替换字符串中的结果，生成一个新的字符串。
例如把字符串中 (\w+) (\w+) 匹配到的结果替换成 Albert Einstein ，可以这样写：

>>> re.sub("(\w+) (\w+)", "Albert Einstein", "Isaac Newton, physicist")
'Albert Einstein, physicist'

re.sub 中第 1 个参数表示匹配的正则表达式，第 2 个参数表示替换表达式，第 3 个参数表示原始字符串

这里的替换表达式是手动指定的新字符串 Albert Einstein ，他和原始字符串中的内容毫不相关。如果希望复用原始字符串中的内容，那么就需要用到 re.sub 的反向引用功能了。

反向引用

反向引用指的是在指定替换结果的过程中，可以引用原始字符串中的匹配到内容。例如 (\w+) (\w+) 在原始字符串中匹配到了 Isaac Newton ，利用匹配到的结果，将结果改写为 FirstName: Isaac, LastName: Newton 。
既然需要引用，那么就得有一个表达式能够表示匹配的内容。恰好 re.sub 的匹配结果也有和 re.match 一样的分组，因此只需要在替换表达式中引用分组的结果即可。引用方式有以下几种：

\number ：例如 \1 ，表示匹配结果中第 1 个分组，也就是例子中的 Isaac 部分。
\gnumber> ：例如 \g1> ，和 \number 表示法一样，也代表了匹配结果中的第 1 个分组。与 \number 表示法相比， \gnumber> 避免了歧义。试想，如果想用 \number 把第 1 个分组匹配到的 Isaac 替换为 Isaac0 ，那么需要用 \10 ，这里本意表示在第 1 个分组后加上 0 ，但程序会识别成第 10 个分组。而使用 \gnumber> 只需要写成 \g1>0 即可。

回到开始的例子中，将匹配结果 Isaac Newton改写为 FirstName: Isaac, LastName: Newton ，可以用以下表达式实现：

>>> re.sub("(\w+) (\w+)", "FirstName: \g1>, LastName: \g2>", "Isaac Newton, physicist")
'FirstName: Isaac, LastName: Newton, physicist'

参考

re — Regular expression operations
Python re(gex)? -- Groupings and backreferences

到此这篇关于Python re.sub 反向引用的实现的文章就介绍到这了,更多相关Python re.sub 反向引用内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

用Python代码自动生成文献的IEEE引用格式的实现
浅析Python模块之间的相互引用问题
python3爬虫中引用Queue的实例讲解
python闭包与引用以及需要注意的陷阱
详解python如何引用包package
python 引用传递和值传递详解(实参,形参)
Python参数传递机制传值和传引用原理详解
Python参数传递对象的引用原理解析
python实现引用其他路径包里面的模块
python关于多级包之间的引用问题

上一篇：Python制作一个随机抽奖小工具的实现
下一篇：python实现简单聊天功能

Python re.sub 反向引用的实现

目录 match 分组 re.sub 匹配和替换反向引用参考 re模块是 Python 标准库中提供的用于处理正则表达式的模块，利用 re模块可以方便的利用正则表达式实现字符串中的匹配、替换等操作 mPython,re.sub,反向,引,用的,...

电销卡的常规使用技巧

电销卡的常规使用技巧相信大家都知道,电销卡具有一个吸人眼球的特点,那就是稳定防...

长沙电话机器人的公司（长沙智能机器人公司）

本篇文章给大家谈谈长沙电话机器人的公司，以及长沙智能机器人公司对应的知识点，...

400电话成监督服务电话

现在很多行业都有属于自己的通讯服务电话，也设立服务监督电话，不过真正发挥监督...

电话销售前景如何？还能做吗？

电话营销是一个传统类型的营销渠道，最辉煌的那几年，几乎满大街都是做电销的。只...

物联网博览会预告丨深圳网亿集团拍了拍你，并送上一份

IOTE 2020第十四届国际物联网博览会将于7月29-31日在深圳会展中心隆重举行作为物联网...

承德电销机器人（承德电销机器人电话）

本文目录一览： 1、如何用智能电话机器人进行电销?2、电销机器人怎么样？3、电销A...

电话回拨外呼系统（外呼系统）

本文目录一览： 1、什么是网络电话外呼系统？2、电销企业为什么需要电话外呼系统？...

上海不标记中间号防封线路商家,电销外呼线路办理公司

一企嗨电话营销系统 1．当前的电销场景有哪些困扰？ 1）手机.卡频繁被封，电销业务...

400电话申请展现企业好优质风貌

一个企业必须要展示出自己的能力，展示出自己在企业发展过程中对我们客户是非常关...

天津高频次电销卡（天津高频次电销卡怎么办理）

今日给各位共享天津高频次电销卡的常识，其间也会对天津高频次电销卡怎样处理进行...

湖州防封号电话呼叫软件哪里有,电话销售系统-本周热搜

湖州防封号电话呼叫软件哪里有,电话销售系统覆盖咨询、推荐、查询等各类任务指令场...

ansible批量部署tomcat的方法

1.1 构建目录结构此操作是安装nginx+mysql+tomcat+db的目录结构，可以参考一下，不错~ mk...

海南电销不封卡哪家正规（海南电话是干什么的）

机器人应用

1.工作单调情绪影响大，人工无法长时间保持工作热情，遇到恶劣对话情景时容易产生...

成都移动外呼系统收费（移动外呼平台）

今日给各位共享成都移动外呼体系收费的常识，其间也会对移动外呼渠道进行解说，假...

Python re.sub 反向引用的实现

全 部 栏 目

目录

match 分组

re.sub 匹配和替换

反向引用

参考

全部栏目