正则表达式之文本模式的匹配和查找-巨人网络通讯

正则表达式之文本模式的匹配和查找

1、需求

我们想要按照特定的文本模式进行匹配或查找。

2、解决方案

如果想要匹配的只是简单的文字，那么通常只需要用基本的字符串方法就可以了，比如str.find()、str.endswith()、str.startswith()或类似函数。

示例：

text='mark ，帅哥，18，183 帅，mark'
print(text=='mark')
print(text.startswith('mark'))
print(text.startswith('mark'))
print(text.find('帅哥'))

结果：

False
True
True
6

如果更为复杂的匹配则需要使用正则表达式以及re模块。为了说明使用正则表达式的基本流程，假设我们想匹配以数字形式构成的日期，比如"11/27/2018"。示例如下：

import re
text1='11/27/2018'
text2='Nov 27, 2018'
if re.match(r'\d+/\d+/\d+',text1):
  print('符合模型：数字/数字/数字')
else:
  print('不符合模型：数字/数字/数字')

if re.match(r'\d+/\d+/\d+',text2):
  print('符合模型：数字/数字/数字')
else:
  print('不符合模型：数字/数字/数字')

运行结果：

符合模型：数字/数字/数字
不符合模型：数字/数字/数字

如果打算针对同一模型做多次匹配，那么通常会先将正则表达式模式预编译成一个模式对象。

例如：

import re
text1='11/27/2018'
text2='Nov 27, 2018'
datepat=re.compile(r'\d+/\d+/\d+')
if datepat.match(text1):
  print('符合模型：数字/数字/数字')
else:
  print('不符合模型：数字/数字/数字')

if datepat.match(text2):
  print('符合模型：数字/数字/数字')
else:
  print('不符合模型：数字/数字/数字')

结果：

符合模型：数字/数字/数字
不符合模型：数字/数字/数字

match()方法总是尝试在字符串的开头找到匹配项。如果想针对整个文本搜索出所有的匹配项，那么就应该使用findall()方法，例如：

import re
text='今天是 11/27/2018，昨天是11/26/2018'
datepat=re.compile(r'\d+/\d+/\d+')
print(datepat.findall(text))

运行结果：

['11/27/2018', '11/26/2018']

当定义正则表达式时，我们常会将部分模式用括号包起来的方式引入捕获组，捕获组通常简化后续对匹配文本的处理，因为每个组的内容都可以单独提取出来。findall()方法搜索整个文本并找出所有的匹配项然后将它们以列表的形式返回。如果想以迭代的方式找出匹配项，可以使用finditer()方法。

例如：

import re
#加入捕获组
datepat=re.compile(r'(\d+)+/(\d+)+/(\d+)')
m=datepat.match('11/27/2018')
print(m.group(0))
print(m.group(1))
print(m.group(2))
print(m.group(3))
print(m.groups())
month,day,year=m.groups()
print(month)
print(day)
print(year)

print('*'*20)

text='今天是 11/27/2018，昨天是11/26/2018'
for month,day,year in datepat.findall(text):
  print('{}-{}-{}'.format(year,month,day))

print('*'*20)

for m in datepat.finditer(text):
  print(m.groups())

结果：

11/27/2018
11
27
2018
('11', '27', '2018')
11
27
2018
********************
2018-11-27
2018-11-26
********************
('11', '27', '2018')
('11', '26', '2018')

3、分析

本节主要介绍了re模块对文本匹配和搜索的基本功能，首先用re.compile()对模式进行编译，然后使用想match()、findall()、finditer()这样的方法做匹配和搜索。

当指定模式时我们通常会使用原始字符串，例如：

r'(\d+)/(\d+)/(\d+)'

这样的字符串不会对反斜字符转义，这在正则表达式中非常有用。否则，我们需要用双反斜杠线来标识一个单独的''，例如：

'(\\d+)/(\\d+)/(\\d+)'

请注意match()方法只会检查字符的开头，有可能出现的匹配的结果并不是你想要的，例如：

import re
#加入捕获组
datepat=re.compile(r'(\d+)+/(\d+)+/(\d+)')
m=datepat.match('11/27/2018xxxx')
print(m)

结果：

re.Match object; span=(0, 10), match='11/27/2018'>

如果想要精确匹配，可以加一个结束标记：$

import re
#加入捕获组
datepat=re.compile(r'(\d+)+/(\d+)+/(\d+)$')
m1=datepat.match('11/27/2018xxxx')
m2=datepat.match('11/27/2018')
print(m1)
print(m2)

结果：

None
re.Match object; span=(0, 10), match='11/27/2018'>

如果只是执行简单的文本匹配和搜索操作，可以省略编译步骤。
如果打算执行很多匹配或查找操作的话，通常需要先将模式编译然后重复使用。模块级的函数会对最近编译过的模式做缓存处理，并且比较省步骤。

总结

以上所述是小编给大家介绍的正则表达式之文本模式的匹配和查找,希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持！
如果你觉得本文对你有帮助，欢迎转载，烦请注明出处，谢谢！

您可能感兴趣的文章:

Java正则表达式实现在文本中匹配查找换行符的方法【经典实例】
Java基于正则表达式实现查找匹配的文本功能【经典实例】
Go语言正则表达式用法实例小结【查找、匹配、替换等】
学习Java正则表达式（匹配、替换、查找）
正则表达式匹配，替换，查找
JAVA中正则表达式匹配，替换，查找，切割的方法

上一篇：正则表达式的使用规则
下一篇：Python 实用技巧之正则表达式查找和替换文本的操作方法

正则表达式之文本模式的匹配和查找

1、需求我们想要按照特定的文本模式进行匹配或查找。 2、解决方案如果想要匹配的只是简单的文字，那么通常只需要用基本的字符串方法就可以了，比如str.find()、str.endswith()、str.正则,表达式,之,文本,模式,...

哈尔滨餐饮加盟外呼系统怎么办理,外呼线路-服务周到

哈尔滨餐饮加盟外呼系统怎么办理,外呼线路这将提高你的可信度，并给你的对手接受你...

linux如何mount挂载磁盘并设置开机自动mount的实现

知道大家时间都很宝贵，我直接把流程命令写下来，大家配置完即可，想研究原理的话...

适合打电销的电话卡的特点

适合打电销的电话卡的特点发货要你企业资料报备，投诉有罚款的卡才是最稳的，不放...

呼叫中心语音系统云呼_电话机器人

提高转化率就是让我们的营销更加有效，避免大量无效的营销，避免营销方面的浪费。...

400电话办理如今是带给我们最美好的影响

事实上来说，我们都感觉到一些电话的办理能够带给我们一定的贡献与作用，其实在当...

租用电话外呼系统（电话外呼系统设备）

本文目次一览： 1、外呼零碎怎样操持？ 2、电销外呼零碎几何钱一个月？ 3、智能外呼...

云外呼系统质量（阿里云外呼系统）

本文目次一览： 1、外呼零碎怎样？好用么？ 2、外呼零碎真的很不错吗？ 3、哪家的外...

所有400电话是免费的吗400是免费的电话吗怎么收费标准

(所有400电话是免费的吗)(400是免费的电话吗怎么收费标准)以下内容400电话加盟由巨人小...

企业使用400电话办理可以有更好服务体验

施耐德电气推出产品保修延长服务，实现与客户关系长期有效的维护。企业办理400电话...

中国移动加快转型流量经营集团层面首次启动策

数据流量爆炸式增长虽然给中国移动带来了一定的收入，但更多的是网络投资压力。中...

400号码接听要钱吗400电话办理费用会受哪些因素影响

作为企业的专属客户服务电话，400电话采用主被称分享的方式。无论是用户打电话还是...

机遇是物联网产业发展中的导火索

物联网是“天”“人”合一的产物，即“天然”与“人工”双重组合之物。追溯“物”...

地图标注-河南发现日侵华时期中国地图标注有矿藏地

中新社新乡5月23日电董飞)记者23日自河南省新乡市博物馆了解到近日该市一位年近百岁...

锦州运输服务监督电话“12328”呼叫中心将开通

建设统一的12328交通运输服务监督电话系统，是交通运输部门落实党的群众路线的重要...

400电话代理助力企业“快”发展

产品上市慢一步，被其他企业生产的同款产品抢了市场先机，服务速度慢一拍，被客户...

正则表达式之文本模式的匹配和查找

全 部 栏 目

全部栏目