aRealDancer 2023-03-09 22:59 采纳率: 0%
浏览 28

如何解析xml文件时,显示xml.etree.ElementTree.ParseError: out of memory: line 1, column 0?(语言-python)

解析xml文件时,显示xml.etree.ElementTree.ParseError: out of memory: line 1, column 0

xml文件大小为1.9G左右

def load_xml(self, file):
        '''function: use the file in XML format
            Args:
                file (str): path to the xml file
            Returns:         
        '''   
        with open(file, 'r', encoding='utf-8') as f:
            xml = f.read()

        #load the xml file
        root = ET.fromstring(xml) #root.tag is document
        for child in root:
                docID = child.find('DOCNO').text #get docID
                content = child.find('TITLE').text + child.find('TAG').text +child.find('ARTIST').text +child.find('YEAR').text +child.find('LYRICS').text #get content
                self.docs_df.loc[docID] = content# use a dataframe to store each doc:docID,content(headline+text)      

  • 写回答

2条回答 默认 最新

  • 文盲老顾 WEB应用领新星创作者 2023-03-09 23:17
    关注

    out of memory,超出内存限制,简单来说,你电脑内存不够

    评论

报告相同问题?

问题事件

  • 创建了问题 3月9日

悬赏问题

  • ¥50 C# 使用DEVMOD设置打印机首选项
  • ¥15 麒麟V10 arm安装gdal
  • ¥15 想用@vueuse 把项目动态改成深色主题,localStorge里面的vueuse-color-scheme一开始就给我改成了dark,不知道什么原因(相关搜索:背景颜色)
  • ¥20 OPENVPN连接问题
  • ¥15 flask实现搜索框访问数据库
  • ¥15 mrk3399刷完安卓11后投屏调试只能显示一个设备
  • ¥100 如何用js写一个游戏云存档
  • ¥15 ansys fluent计算闪退
  • ¥15 有关wireshark抓包的问题
  • ¥15 需要写计算过程,不要写代码,求解答,数据都在图上