最近呢,公司让写一个组件,要求用正则表达式构建一个中文的匹配组件,许多问题就来了,大多是用自动机来构建一个正则表达式的引擎,小编虽然大学的时候学过编译原理,可奈何现在已经忘得差不多了,只能通过现有的正则表达式来进行功能实现。
下面的代码呢实现了通过用正则表达式来对某一个句子的添加、替换、删除三种操作,不知道这个适不适合大家的口味,反正小编已经做好让公司头批评的准备了,因此小编是在是现学不来呀。
# -*- conding:utf-8 -*-
import re
txt = '这个池子的体积大约是34立方米容积'
'''role为匹配规则,re_out为替换部分格式为“\1(替换部分)”'''
def Replace(role,re_out):
out = re.compile(role)
String_out = out.sub(re_out,txt)
print(String_out)
Replace(r'(这个池子的体积大约是34)(.*)',r'\1平方米')
'''
role为匹配规则,num为将要删除的元素(从1开始)
'''
def Delete(role,num):
out = re.search(role,txt).group(num)
string = txt.split(out)
String_out = ''.join(string)
print(String_out)
Delete('(这个池子的体积大约是34)(.*)(容积)',2)
def Add(role,re_out):
out = re.compile(role)
String_out = out.sub(re_out,txt)
print(String_out)
Add(r'(这个池子的体积大约是34)(.{0})',r'\1的')
下面的图片是小编运行这三个函数得到的结果,大家可以看看,如果有需要的可以参考一下,另外,小编需要人告诉我这个正则表达式如何用自动机来实现,他的原理是什么,欢迎大家的留言哦。
以上所述是小编给大家介绍的正则表达式实现添加、删除、替换三种功能,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!