python sax模块解析xml遇到非法字符怎么解决？

用python的sax模块解析xml的时候出现非法字符直接停止了，百度搜到有大神说用回调函数处理当前的非法字符或者跳过直接运行接下来的内容。不过具体应该怎么实现呢？求大神赐教。下面是我的代码，非法字符是出现再其中的很多个tagname="url"中的内容，能在原来的基础上改就更好了，再次感谢

import xml.sax

class XmlHandler( xml.sax.ContentHandler ):
    def __init__(self):
        self.CurrentData = ""
        self.url = ""
        self.id = ""
        self.detail = ""

   # 元素开始事件处理
    def startElement(self, name,attr):
        self.CurrentData = name
        if name == "entry":
            print("*****Entry*****")

   # 元素结束事件处理
    def endElement(self, name):
        if self.CurrentData == "url":
            print("url:", self.url)
        elif self.CurrentData == "phish_id":
            print("phish_id:", self.id)
        elif self.CurrentData == "phish_detail_url":
            print("phish_detail_url:", self.detail)
        self.CurrentData = ""
   # 内容事件处理
    def characters(self, content):
        if self.CurrentData == "url":
            self.url = content
        elif self.CurrentData == "phish_id":
            self.id = content
        elif self.CurrentData == "phish_detail_url":
            self.detail = content
        else:


if __name__ == "__main__":
    # 创建一个 XMLReader
    parser = xml.sax.make_parser()
    # turn off namepsaces
    parser.setFeature(xml.sax.handler.feature_namespaces, 0)

    # 重写 ContextHandler
    Handler = XmlHandler()
    parser.setContentHandler( Handler )
    parser.parse("online-valid.xml")

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2015-10-20 23:43
关注
这是一个非法的 XML，正常的解析应该拿它没办法。

如果你确定这个 XML 文档里面不可能出现任何的 XML entity，可以先替换 & 字符为 & 再解析。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

jaxb转xml来调用webservice遇到的问题 java xml
2022-10-10 10:47

回答 2 已采纳第一个问题：是不是没有resource配置文件，或者配置文件位置不对第二个问题去掉：call.setReturnClass(java.lang.String[].class);
Android解析百兆XML文件只能解析一部分内容 android xml
2023-01-13 16:34

回答 2 已采纳内存溢出吗？有报错吗？检查一下 xml 的完整性
使用Go解析巨大的XML文件 xml
2014-11-05 11:41

回答 1 已采纳 I parse wikipedia xml dumps (~50GB xml files) in go-wikiparse using plain struct/reflect decoding.
Python使用sax模块解析XML文件示例
2020-09-19 11:59

主要介绍了Python使用sax模块解析XML文件,结合实例形势分析了Python使用sax模块针对xml文件进行读取、解析、内容处理等相关操作技巧,需要的朋友可以参考下
基本的DOM XML解析器需要什么？ xml
2010-09-15 00:09

回答 2 已采纳 First of all: if you specifically want to do DOM parser, you need to implement DOM API. But I am n
Android 依赖冲突咋解决？ android jar java
2022-04-10 18:46

回答 1 已采纳 api('com.github.gzu-liyujiang.AndroidPicker:WheelPicker:1.5.6.20181018') {//依赖的包 exclude group:
解析XML文件时出现如下错请问如何解决？？
2011-10-28 10:59

回答 2 已采纳 '' is not a valid value for 'integer' 空值不是一个整型，你得看看你的xml文件中有没有这样的数据，得修改
Python使用SAX解析xml文件
2023-02-02 15:03

银痕的博客 Python使用SAX解析XML文件
带有换行符字符样本的Android SAX Parser？ android php xml
2011-04-10 17:39

回答 1 已采纳 I had the same problem as you. I found this solution to a similar problem and adapted it to this o
hibernate异常，请问大家这是什么异常，该如何解决？ hibernate xml
2018-11-14 17:23

回答 3 已采纳 Caused by: org.xml.sax.SAXParseException; lineNumber: 14; columnNumber: 70; 必须声明元素类型 "many_to_many"。
proxool sax解析错误问题 java xml
2015-08-17 04:01

回答 1 已采纳删除第一行重新写就行了
Python3基于sax解析xml操作示例
2020-09-20 11:52

主要介绍了Python3基于sax解析xml操作,结合实例形式分析了Python3使用sax解析xml文档的相关原理与实现技巧,需要的朋友可以参考下
sax 解析：从 div 标签中获取值 android
2013-05-21 06:53

回答 2 已采纳使用下面的代码，应该能达到你要的功能。 currentTag = localName; if ("tag1".equalsIgnoreCase(
Python通过DOM和SAX方式解析XML的应用实例分享
2020-09-21 19:12

主要介绍了Python通过DOM和SAX方式解析XML的应用实例分享,针对这两种解析方式Python都有相关的模块可供使用,需要的朋友可以参考下
python解析xml模块封装代码
2021-01-20 05:02

下面介绍python解析xml文件的几种方法，使用python模块实现。方式1，python模块实现自动遍历所有节点：复制代码代码如下:#!/usr/bin/env python # -*- coding: utf-8 -*- from xml.sax.handler i
没有解决我的问题, 去提问

悬赏问题

¥15 基于卷积神经网络的声纹识别
¥15 Python中的request，如何使用ssr节点，通过代理requests网页。本人在泰国，需要用大陆ip才能玩网页游戏，合法合规。
¥100 为什么这个恒流源电路不能恒流？
¥15 有偿求跨组件数据流路径图
¥15 写一个方法checkPerson，入参实体类Person，出参布尔值
¥15 我想咨询一下路面纹理三维点云数据处理的一些问题，上传的坐标文件里是怎么对无序点进行编号的，以及xy坐标在处理的时候是进行整体模型分片处理的吗
¥15 CSAPPattacklab
¥15 一直显示正在等待HID—ISP
¥15 Python turtle 画图
¥15 stm32开发clion时遇到的编译问题

python sax模块解析xml遇到非法字符怎么解决？

1条回答 默认 最新

悬赏问题

1条回答默认最新