Python爬虫正则表达式常用符号和方法-巨人网络通讯

企业400电话

微网小程序

AI电话机器人

电商代运营

全部栏目

企业400电话网络优化推广 AI电话机器人呼叫中心网站建设商标✡知产微网小程序电商运营彩铃•短信增值拓展业务

Python爬虫正则表达式常用符号和方法

正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。得益于这一点，在提供了正则表达式的语言里，正则表达式的语法都是一样的，区别只在于不同的编程语言实现支持的语法数量不同；但不用担心，不被支持的语法通常是不常用的部分。

1、常用符号

. ：匹配任意字符，换行符 \n 除外

：匹配前一个字符0次或无限次
? ：匹配前一个字符0次或1次

.* ：贪心算法，尽可能的匹配多的字符

.*? ：非贪心算法

() ：括号内的数据作为结果返回

2、常用方法

findall：匹配所有符合规律的内容，返回包含结果的列表

Search：匹配并提取第一个符合规律的内容，返回一个正则表达式对象

Sub：替换符合规律的内容，返回替换后的值

3、使用示例

（1）. 的使用举例，匹配任意字符，换行符 \n 除外

import re #导入re库文件

a = 'xy123'

b = re.findall('x..',a)

print b

打印的结果为：['xy1'] ，每个 . 表示一个占位符

（2） * 的使用举例，匹配前一个字符0次或无限次

a = 'xyxy123'

b = re.findall('x*',a)

print b

打印的结果为：['x', '', 'x', '', '', '', '', '']

（3） ? 的使用举例，匹配前一个字符0次或1次

a = 'xy123'

b = re.findall('x?',a)

print b

打印的结果为：['x', '', '', '', '', '']

（4） .* 的使用举例

secret_code = 'hadkfalifexxIxxfasdjifja134xxlovexx23345sdfxxyouxx8dfse'

b = re.findall('xx.*xx',secret_code)

print b

打印的结果为：['xxIxxfasdjifja134xxlovexx23345sdfxxyouxx']

（5）.*？的使用举例

secret_code = 'hadkfalifexxIxxfasdjifja134xxlovexx23345sdfxxyouxx8dfse'

c = re.findall('xx.*?xx',secret_code)

print c

打印的结果为：['xxIxx', 'xxlovexx', 'xxyouxx']

（6） ()的使用举例

secret_code = 'hadkfalifexxIxxfasdjifja134xxlovexx23345sdfxxyouxx8dfse'

d = re.findall('xx(.*?)xx',secret_code)

print d

打印的结果为：['I', 'love', 'you'] ，括号内的数据作为返回的结果

（7） re.S的使用举例

s = '''sdfxxhello

xxfsdfxxworldxxasdf'''

d = re.findall('xx(.*?)xx',s,re.S)

print d

打印的结果为：['hello\n', 'world'] ，re.S的作用是使 . 在匹配时包括 \n

（8） findall的使用举例

s2 = 'asdfxxIxx123xxlovexxdfd'

f2 = re.findall('xx(. ?)xx123xx(. ?)xx',s2)

print f20

打印的结果为：love

这时f2为含有一个元组的列表，该元组包含两个元素，该元组中的两个元素为两个()匹配到的内容，如果s2包含多个'xx(. ?)xx123xx(. ?)xx'这样的子串，则f2包含多个元组；

（9） search的使用举例

s2 = 'asdfxxIxx123xxlovexxdfd'

f = re.search('xx(. ?)xx123xx(. ?)xx',s2).group(2)

print f

打印的结果为：love

.group(2) 表示返回第二个括号匹配到的内容，如果是 .group(1), 则打印的就是：I

（10）sub的使用举例

s = '123rrrrr123'

output = re.sub('123(.*?)123','123%d123'%789,s)

print output

打印的结果为：123789123

其中的%d类似于C语言中的%d，如果 output=re.sub('123(.*?)123','123789123',s)，输出结果也为： 123789123

（11） \d 的使用举例，用于匹配数字

a = 'asdfasf1234567fasd555fas'

b = re.findall('(\d+)',a)

print b

打印的结果为：['1234567', '555'] ， \d+ 可以匹配数字字符串；

以上就是python爬虫正则表达式的一些常用符号和语法，希望对python初学者学习有所帮助。

您可能感兴趣的文章:

零基础写python爬虫之神器正则表达式
Python的爬虫包Beautiful Soup中用正则表达式来搜索
python3爬虫之入门基础和正则表达式
python爬虫正则表达式使用技巧及爬取个人博客的实例讲解
python爬虫正则表达式之处理换行符
玩转python爬虫之正则表达式
Python爬虫之正则表达式基本用法实例分析
Python 爬虫学习笔记之正则表达式
Python爬虫之正则表达式的使用教程详解
Python爬虫教程之利用正则表达式匹配网页内容

上一篇：正则表达式断言、巡视（Assertions）、正向断言、反向断言介绍
下一篇：基于Python正则表达式提取搜索结果中的站点地址

相关文章

Python爬虫正则表达式常用符号和方法

正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。得益于这Python,爬虫,正则,表达式,...

从业务扎堆到精神领航—谈新员工培训一些有效做法

呼叫中心的新员工培训工作，在人员紧缺、接通率难以达标的各种压力下，往往出现“...

济南房产电销外呼线路收费,外呼机器人-了解详情

一企嗨电话营销系统 1．当前的电销场景有哪些困扰？ 1）手机.卡频繁被封，电销业务...

河北电销外呼系统收费（郑州电销外呼系统）

本篇文章给我们谈谈河北电销外呼体系收费，以及郑州电销外呼体系对应的常识点，期...

营口回拨外呼系统（电话外呼回拨系统）

今天给各位分享营口回拨外呼系统的知识，其中也会对电话外呼回拨系统进行解释，如...

运城好用的智能电话机器人供应商(运城好用的智能电话

认知＆尝鲜福利：想聆听一下人与电话机器人运城好用的智能电话机器人供应商的交流...

温州电销电话机器人哪家好（电销电话智能机器人）

本篇文章给大家谈谈温州电销电话机器人哪家好，以及电销电话智能机器人对应的知识...

使用电话进行销售时有什么技巧和方法

对于电话销售是现在比较多的一个行业，但是在进行电话的销售过程中需要了解哪些技...

我国商标保护模式与商标法原理不符

我国商标保护模式与商标法原理不符商标是经营者用来标识其提供的商品或服务,并借...

部分旧MacBook机型升级macOS Big Sur失败怎么办? 苹果官方临

在本周四发布的官方更新文档中，苹果详细介绍了如何解决某些 MacBook Pro 机型在安装...

Win8系统VMware虚拟机挂载硬盘提示＂无法挂载硬盘＂的故

win8操作系统VMware虚拟机来安装别的操作系统，在操作挂载硬盘时却遇到了问题，提示无...

400开头的号码一分钟多少钱拨打400开头的号码怎么收费

(400开头的号码一分钟多少钱)(拨打400开头的400选号大厅号码怎么收费)以下内容由巨人小...

物联卡成为孩子在校安全的保护伞

当今社会生存压力大，很多父母为了挣取更多的钱给孩子提供好的生活质量大部分时间...

下载神奇电话机器人视频（电话机器人效果怎么样?）

*** 本文目录一览：1、视频号下载机器人收费吗2、打电话语音机器人怎么弄3、视频下载...

外呼系统电信（电话外呼系统什么意思）

本文目录一览： 1、外呼体系哪种比较好2、现在市面上那么多的外呼体系，怎样挑选？...

400电话申请对一个企业到底有多重要

随着国家对中小企业的扶持力度的增大，市场的开放，需求的增加，人才的涌现，一部...

Python爬虫正则表达式常用符号和方法

正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。得益于这Python,爬虫,正则,表达式,...

© 2016-2020 巨人网络通讯版权所有

《增值电信业务经营许可证》苏ICP备15040257号-8

Python爬虫正则表达式常用符号和方法 Python,爬虫,正则,表达式,