分析如何在Python中解析和修改XML-巨人网络通讯

分析如何在Python中解析和修改XML

一、什么是XML？

XML代表可扩展标记语言。它在外观上类似于HTML，但XML用于数据表示，而HTML用于定义正在使用的数据。XML专门设计用于在客户端和服务器之间来回发送和接收数据。看看下面的例子：

例子：

? xml version ="1.0" encoding ="UTF-8" ?>
 metadata>
 food>
     item name ="breakfast" > Idly /item>
     price> $2.5 /price>
     description>
   两个 idly's with chutney
     /description>
     calories> 553 /calories>
 /food>
 food>
     item name ="breakfast" > Paper Dosa /item>
     price> $2.7 /price>
     
        calories> 700 /calories>
 /food>
 food>
     item name ="breakfast" > Upma /item>
     price> $3.65 /price>
     description>
     Rava upma with bajji
     /description>
     calories> 600 /calories>
 /food>
 food>
     item name ="breakfast" > Bisi Bele Bath /item>
     price> $4.50 /price>
     description>
   Bisi Bele Bath with sev
     /description>
     calories> 400 /calories>
/food>
 food>
     item name ="breakfast" > Kesari Bath /item>
     price> $1.95 /price>
     description>
    藏红花甜拉瓦
    /description>
     calories> 950 /calories>
 /食物>
 /元数据>

上面的示例显示了我命名为“Sample.xml”的文件的内容，我将在此Python XML解析器教程中为所有即将推出的示例使用相同的内容。

二、Python XML解析模块

Python允许使用两个模块解析这些XML文档，即xml.etree.ElementTree模块和Minidom（最小DOM实现）。解析意味着从文件中读取信息并通过识别该特定XML文件的部分将其拆分为多个部分。让我们进一步了解如何使用这些模块来解析XML数据。

2.1、xml.etree.ElementTree模块

该模块帮助我们在树结构中格式化XML数据，这是分层数据的最自然表示。元素类型允许在内存中存储分层数据结构，并具有以下属性：

ElementTree是一个包装元素结构并允许与XML相互转换的类。现在让我们尝试使用python模块解析上述XML文件。

有两种使用“ElementTree”模块解析文件的方法。第一个是使用parse()函数，第二个是fromstring()函数。parse()函数解析作为文件提供的XML文档，而fromstring解析作为字符串提供的XML，即在三引号内。

使用parse()函数：

如前所述，该函数采用文件格式的XML来解析它。看下面的例子：

例子：

import xml.etree.ElementTree as ET
mytree = ET.parse('sample.xml')
myroot = mytree.getroot()

如您所见，您需要做的第一件事是导入xml.etree.ElementTree模块。然后，parse()方法解析“Sample.xml”文件。getroot()方法返回“Sample.xml”的根元素。

执行上述代码时，您不会看到返回的输出，但不会出现表明代码已成功执行的错误。要检查根元素，您可以简单地使用print语句，如下所示：

例子：

import xml.etree.ElementTree as ET
mytree = ET.parse('sample.xml')
myroot = mytree.getroot()
print(myroot)

输出：

元素'元数据'在0x033589F0>

上面的输出表明我们的XML文档中的根元素是“元数据”。

使用fromstring()函数：

您还可以使用fromstring()函数来解析您的字符串数据。如果要执行此操作，请将XML作为字符串传递给三引号，如下所示：

import xml.etree.ElementTree as ET
data='''?xml version="1.0" encoding="UTF-8"?>
metadata>
food>
    item name="breakfast">Idly/item>
    price>$2.5/price>
    description>
   Two idly's with chutney
   /description>
    calories>553/calories>
/food>
/metadata>
'''
myroot = ET.fromstring(data)
#print(myroot)
print(myroot.tag)

上面的代码将返回与前一个相同的输出。请注意，用作字符串的XML文档只是“Sample.xml”的一部分，我使用它来提高可见性。您也可以使用完整的XML文档。

您还可以使用“标签”对象检索根标签，如下所示：

例子：

print(myroot.tag)

输出：

元数据

您还可以通过指定要在输出中看到的字符串部分来对标签字符串输出进行切片。

例子：

print(myroot.tag[0:4])

输出：

元

如前所述，标签也可以具有字典属性。要检查根标记是否具有任何属性，您可以使用“attrib”对象，如下所示：

例子：

print(myroot.attrib)

输出：

{}

如您所见，输出是一个空字典，因为我们的根标签没有属性。

寻找感兴趣的元素：

根也由子标签组成。要检索根标记的子项，您可以使用以下命令：

例子：

print(myroot[0].tag)

输出：

食物

现在，如果要检索根的所有第一个子标签，可以使用for循环迭代它，如下所示：

例子：

for x in myroot[0]:
     print(x.tag, x.attrib)

输出：

item {'name': 'breakfast'}
价格{}
描述{}
卡路里{}

返回的所有项目都是食物的子属性和标签。

要使用ElementTree将文本从XML中分离出来，您可以使用text属性。例如，如果我想检索有关第一个食品的所有信息，我应该使用以下代码：

例子：

for x in myroot[0]:
        print(x.text)

输出：

懒懒地
$ 2.5
两悠闲地与酸辣酱的
553

可以看到，第一项的文本信息已经作为输出返回了。现在，如果您想显示具有特定价格的所有商品，您可以使用get()方法。此方法访问元素的属性。

例子：

for x in myroot.findall('food'):
    item =x.find('item').text
    price = x.find('price').text
    print(item, price)

输出：

Idly$2.5
Paper Dosa$2.7
Upma$3.65
Bisi Bele Bath$4.50
Kesari Bath$1.95

上面的输出显示了所有必需的项目以及每个项目的价格。使用ElementTree，您还可以修改XML文件。

修改XML文件：

可以操作XML文件中的元素。为此，您可以使用set()函数。让我们首先看看如何向XML添加一些东西。

添加到XML：

以下示例显示了如何在项目描述中添加内容。

例子：

for description in myroot.iter('description'):
     new_desc = str(description.text)+'wil be served'
     description.text = str(new_desc)
     description.set('updated', 'yes')
 
mytree.write('new.xml')

write()函数帮助创建一个新的xml文件并将更新的输出写入相同的文件。但是，您也可以使用相同的功能修改原始文件。执行完上述代码后，您将能够看到已创建具有更新结果的新文件。

上图显示了对我们食品的修改描述。要添加新的子标签，您可以使用SubElement()方法。例如，如果您想在第一项Idly中添加一个新的专业标签，您可以执行以下操作：

例子：

ET.SubElement(myroot[0], 'speciality')
for x in myroot.iter('speciality'):
     new_desc = 'South Indian Special'
     x.text = str(new_desc)
 
mytree.write('output5.xml')

输出：

如您所见，在第一个食品标签下添加了一个新标签。通过在[]括号内指定下标，您可以在任何地方添加标签。现在让我们看一下如何使用此模块删除项目。

从XML中删除：

要使用ElementTree删除属性或子元素，您可以使用pop()方法。此方法将删除用户不需要的所需属性或元素。

例子：

myroot[0][0].attrib.pop('name', None)
 
# create a new XML file with the results
mytree.write('output5.xml')

输出：

上图显示name属性已从item标记中删除。要删除完整的标签，您可以使用相同的pop()方法，如下所示：

例子：

myroot[0].remove(myroot[0][0])
mytree.write('output6.xml')

输出：

输出显示食品标签的第一个子元素已被删除。如果要删除所有标签，可以使用clear()函数，如下所示：

例子：

myroot[0].clear()
mytree.write('output7.xml')

输出：

执行上述代码时，food标签的第一个子标签将被完全删除，包括所有子标签。到这里为止，我们一直在使用这个Python XML解析器教程中的xml.etree.ElementTree模块。现在让我们看看如何使用Minidom解析XML。

2.2、xml.dom.minidom模块

这个模块基本上是由精通DOM（文档对象模块）的人使用的。DOM应用程序通常首先将XML解析为DOM。在xml.dom.minidom中，这可以通过以下方式实现：

使用parse()函数：

第一种方法是通过提供要解析的XML文件作为参数来使用parse()函数。例如：

例子：

from xml.dom import minidom
p1 = minidom.parse("sample.xml");

执行此操作后，您将能够拆分XML文件并获取所需的数据。您还可以使用此函数解析打开的文件。

例子：

dat=open('sample.xml')
p2=minidom.parse(dat)

在这种情况下，存储打开文件的变量作为参数提供给解析函数。

使用parseString()方法：

当您想要提供要作为字符串解析的XML时，将使用此方法。

例子：

p3 = minidom.parseString('myxml>Usingempty/> parseString/myxml>')

您可以使用上述任何一种方法来解析XML。现在让我们尝试使用此模块获取数据。

寻找感兴趣的元素：

在我的文件被解析后，如果我尝试打印它，返回的输出会显示一条消息，表明存储解析数据的变量是DOM对象。

例子：

dat=minidom.parse('sample.xml')
print(dat)

输出：

xml.dom.minidom.Document对象在0x03B5A308>

使用GetElementByTagName访问元素：

例子：

tagname= dat.getElementsByTagName('item')[0]
print(tagname)

如果我尝试使用GetElementByTagName方法获取第一个元素，我将看到以下输出：

输出：

DOM元素：0xc6bd00处的项目>

请注意，只返回了一个输出，因为为了方便我使用了[0]下标，这将在进一步的示例中删除。

要访问属性的值，我必须按如下方式使用value属性：

例子：

dat = minidom.parse('sample.xml')
tagname= dat.getElementsByTagName('item')
print(tagname[0].attributes['name'].value)

输出：

早餐

要检索这些标签中存在的数据，您可以使用data属性，如下所示：

例子：

print(tagname[1].firstChild.data)

输出：

纸Dosa

您还可以使用value属性拆分和检索属性的值。

例子：

print(items[1].attributes['name'].value)

输出：

早餐

要打印出我们菜单中可用的所有项目，您可以遍历这些项目并返回所有项目。

例子：

for x in items:
    print(x.firstChild.data)

输出：

袖手旁观
纸DOSA
UPMA
碧斯百丽沐浴
Kesari浴

要计算菜单上的项目数，您可以使用len()函数，如下所示：

例子：

print(len(items))

输出指定我们的菜单包含5个项目。

这使我们结束了本Python XML解析器教程。我希望你已经清楚地了解了一切。

以上就是分析如何在Python中解析和修改XML的详细内容，更多关于Python解析和修改XML的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

Python lxml库的简单介绍及基本使用讲解
Python xmltodict模块安装及代码实例
python读取xml文件方法解析
Python将字典转换为XML的方法
python读取配置文件方式(ini、yaml、xml)
python 截取XML中bndbox的坐标中的图像,另存为jpg的实例
python代码xml转txt实例
python:批量统计xml中各类目标的数量案例
利用 Python ElementTree 生成 xml的实例
Python3 xml.etree.ElementTree支持的XPath语法详解

上一篇：DjangoRestFramework 使用 simpleJWT 登陆认证完整记录
下一篇：python使用tcp传输图片数据

分析如何在Python中解析和修改XML

目录一、什么是XML？二、Python XML解析模块 2.1、xml.etree.ElementTree模块 2.2、xml.dom.minidom模块一、什么是XML？ XML代表可扩展标记语言。它在外观上类似于HTML，但XML用于数据表示，而HTML用分析,如,何在,Python,中,解析,...

长春呼叫系统的价格

汇港通自主研发基于大数据、云计算的产品。帮助中小企业提率，提升管理，优化运维...

第三方网站在线客服系统，多渠道接入

随着电子商务的快速发展，在线客服系统在各行业的应用也越来越广泛。通过在线客服...

如何购买正规物联卡,怎么选择物联卡代理公司

目前，物联网卡的销售渠道有很多，线上的，线下人，据小编调查，目前大部分人购买...

Win8.1下IE11浏览器如何添加网址收藏常用的网站

保存常用的网站是多数人使用浏览器的习惯，这个行为被称之为添加收藏或添加书签。...

商丘400申请：走进黄河文化之城的机遇与挑战-商丘400申

商丘作为黄河文化的重要代表之一，历史悠久、文化灿烂。而商丘400申请，则是将这座...

湖州餐饮加盟电话销售系统办理服务商,外呼系统-本周热

湖州餐饮加盟电话销售系统办理服务商,外呼系统跟进比较困难，员工呼出电话之后信息...

MySQL索引是啥?不懂就问

目录概述从二叉树到B+树聚集索引非聚集索引联合索引和覆盖索引 B+树索引VS哈希索...

昆明企业电销机器人价格（电销机器人厂家）

本文目录一览： 1、电销机器人到底多少钱？价格来去怎么这么大？2、电销机器人一年...

智能客服系统基本功能介绍

智能客服系统是一种能够通过与用户的交互实现智能客服的系统。智能客服系统通过对...

广州防封电销系统如何搭建

电销系统专门用的线路市场上有很多正规的线路都是有全地域的线路，如果公司业务对...

安庆电话机器人（安庆电话机器人系统）

本文目录一览：1、能率燃气灶售后服务电话(全国统一)24小时人工客服2、电话是那年创...

无锡知识产权外呼系统办理商家,电话营销系统-详情报价

无锡知识产权外呼系统办理商家,电话营销系统全部振铃、轮番振、近接通、少接通、随...

使用Ajax实现简单的带百分比进度条实例

需求：当进行文件长传保存等操作时，能在页面显示一个带百分比的进度条，给用户一...

电销话术通关评分卡（电销话术分析）

本文目录一览：1、电销的销售话术技巧2、做电销的话术有哪些?3、史上最齐全的电销技...

电销机器人电销机器人类云呼_电话机器人

如果客户在外呼过程中愿意被转入人工服务，说明他对产品的意向比较正向的。如果能...

分析如何在Python中解析和修改XML

全 部 栏 目

目录

一、什么是XML？

二、Python XML解析模块

2.1、xml.etree.ElementTree模块

2.2、xml.dom.minidom模块

全部栏目