Python'解析xml文件，每个dom放一个元素里


<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:image="http://www.google.com/schemas/sitemap-image/1.1" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd http://www.google.com/schemas/sitemap-image/1.1 http://www.google.com/schemas/sitemap-image/1.1/sitemap-image.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>https://www.u9seo.com/356584.html</loc>
        <lastmod>2021-05-14T08:54:33+08:00</lastmod>
    </url>
    <url>
        <loc>https://www.u9seo.com/356582.html</loc>
        <lastmod>2021-05-14T08:53:56+08:00</lastmod>
    </url>
    <url>
        <loc>https://www.u9seo.com/356580.html</loc>
        <lastmod>2021-05-14T08:53:37+08:00</lastmod>
    </url>
    <url>
        <loc>https://www.u9seo.com/356578.html</loc>
        <lastmod>2021-05-14T08:53:23+08:00</lastmod>
    </url>
    <url>
        <loc>https://www.u9seo.com/356576.html</loc>
        <lastmod>2021-05-14T08:52:52+08:00</lastmod>
    </url>
    <url>
        <loc>https://www.u9seo.com/356574.html</loc>
        <lastmod>2021-05-14T08:52:36+08:00</lastmod>
    </url>

一个url就是一个dom，怎么写呢

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

没掉发的程序员山东创站网络科技有限公司官方账号 2023-03-09 13:35

关注

可以使用Python中的ElementTree库来解析XML。

首先，我们需要将字符串解析为XML元素对象，可以使用ElementTree库中的fromstring()方法实现。

然后通过ElementTree库中的findall()方法，查找sitemap元素，再通过元素的子元素loc和lastmod获取对应的值。

以下是具体代码实现：

import xml.etree.ElementTree as ET

content = '''<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <sitemap>
        <loc>https://www.u9seo.com/post-sitemap1.xml</loc>
        <lastmod>2022-10-22T22:04:43+08:00</lastmod>
    </sitemap>
</sitemapindex>'''

# 解析XML
root = ET.fromstring(content)

# 判断是否为sitemapindex类型
if root.tag == '{http://www.sitemaps.org/schemas/sitemap/0.9}sitemapindex':
    # 获取所有子元素sitemap
    sitemaps = root.findall('{http://www.sitemaps.org/schemas/sitemap/0.9}sitemap')
    
    # 遍历获取loc和lastmod值
    for sitemap in sitemaps:
        loc = sitemap.find('{http://www.sitemaps.org/schemas/sitemap/0.9}loc').text
        lastmod = sitemap.find('{http://www.sitemaps.org/schemas/sitemap/0.9}lastmod').text
        
        # 打印测试
        print('loc:', loc)
        print('lastmod:', lastmod)
else:
    print('不是sitemapindex类型')

输出的结果为：

loc: https://www.u9seo.com/post-sitemap1.xml
lastmod: 2022-10-22T22:04:43+08:00

可以看到成功解析初其中的loc和lastmod参数。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

python 解析XML python模块xml.dom解析xml实例代码
2020-12-24 10:26

本文将深入探讨如何使用`xml.dom.minidom`解析XML文件，并提供一个具体的实例代码。 `xml.dom.minidom`是Python中的一个DOM（Document Object Model）解析器，它允许开发者以对象的形式操作XML文档。DOM是一种标准...
python解析xml文件实例分析
2020-09-22 00:34

本实例分析了如何使用Python解析XML文件，特别是如何获取XML文件中的节点和字段。首先，我们需要导入`xml.dom.minidom`模块，这个模块提供了XML文档对象模型（DOM）的实现，允许我们以树形结构处理XML文档。 ```...
python中利用xml.dom模块解析xml的方法教程
2020-09-21 08:09

为了处理XML文档，Python提供了xml.dom模块，它提供了DOM（Document Object Model）接口，用于解析XML并将其表示为一个树形结构，便于操作和查询。一、XML的基本概念与特征 1. XML是基于标签对的，如`<aa></aa>`。...
深入解读Python解析XML的几种方式
2020-12-25 13:29

本文将介绍深入解读利用Python语言解析XML文件的几种方式，并以笔者推荐使用的ElementTree模块为例，演示具体使用方法和场景。文中所使用的Python版本为2.7。一、什么是XML? XML是可扩展标记语言（Extensible ...
python读取xml文件方法解析
2020-09-16 10:32

在Python编程中，读取XML文件是常见的任务，特别是在处理结构化数据时。XML（可扩展标记语言）是一种用于标记数据、定义数据类型的语言，它允许用户自定义标记语言。XML文件通常包含嵌套的标签结构，类似于HTML，但...
干货|Python XML解析
2025-01-16 09:31

WANGWUSAN66的博客 DOM 的解析器在解析一个 XML 文档时，一次性读取整个文档，把文档中所有元素保存在内存中的一个树结构里，之后你可以利用DOM 提供的不同的函数来读取或修改文档的内容和结构，也可以把修改过的内容写入xml文件。...
Python 解析 XML 文件的基本方法
2025-03-25 14:27

思维交错的博客 ``htmlPython 解析 XML 文件的基本方法。
Python解析XML，一篇文章教你秒懂，分分钟拿下！
2024-06-12 14:38

图灵学者的博客 ElementTree是Python标准库中的一个模块，专门用于处理XML数据。它提供了一种简单且高效的方式来解析、创建、遍历和修改XML文档。ElementTree的核心类包括Element代表XML中的元素，以及代表整个XML文档树。Element...
使用 Python 解析 XML —— 终极指南 2024
2024-08-14 17:13

Decodo的博客 XML（可扩展标记语言）是一种标记语言，用于许多旨在存储和传输数据的应用程序中。它是创建结构化文档以及在网络上不同系统和应用程序之间交换数据的标准。XML 文件使用标记来定义文档中的元素，类似于 HTML（超文本...
Python如何生成xml文件
2020-09-16 18:29

`ET.iterparse()`方法允许在解析过程中处理每个元素，而无需加载整个文档到内存。ET的性能通常与SAX相当，但API更友好，使用起来更简单。在选择XML处理方法时，需要根据具体需求来决定。如果需要对整个文档进行...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月9日

Python'解析xml文件，每个dom放一个元素里

2条回答 默认 最新

问题事件

2条回答默认最新