aRealDancer 2023-03-09 22:59 采纳率: 0%
浏览 20

如何解析xml文件时,显示xml.etree.ElementTree.ParseError: out of memory: line 1, column 0?(语言-python)

解析xml文件时,显示xml.etree.ElementTree.ParseError: out of memory: line 1, column 0

xml文件大小为1.9G左右

def load_xml(self, file):
        '''function: use the file in XML format
            Args:
                file (str): path to the xml file
            Returns:         
        '''   
        with open(file, 'r', encoding='utf-8') as f:
            xml = f.read()

        #load the xml file
        root = ET.fromstring(xml) #root.tag is document
        for child in root:
                docID = child.find('DOCNO').text #get docID
                content = child.find('TITLE').text + child.find('TAG').text +child.find('ARTIST').text +child.find('YEAR').text +child.find('LYRICS').text #get content
                self.docs_df.loc[docID] = content# use a dataframe to store each doc:docID,content(headline+text)      

  • 写回答

2条回答 默认 最新

  • 文盲老顾 WEB应用领新星创作者 2023-03-09 23:17
    关注

    out of memory,超出内存限制,简单来说,你电脑内存不够

    评论

报告相同问题?

问题事件

  • 创建了问题 3月9日

悬赏问题

  • ¥15 提问一个关于vscode相关的环境配置问题,就是输入中文但是显示不出来,代码在idea可以显示中文,但在vscode不行,不知道怎么配置环境
  • ¥15 netcore使用PuppeteerSharp截图
  • ¥20 这张图页脚具体代码该怎么写?
  • ¥20 WPF MVVM模式 handycontrol 框架, hc:SearchBar 控件 Text="{Binding NavMenusKeyWords}" 绑定取不到值
  • ¥15 需要手写数字信号处理Dsp三个简单题 不用太复杂
  • ¥15 数字信号处理考试111
  • ¥15 allegro17.2生成bom表是空白的
  • ¥15 请问一下怎么打通CAN通讯
  • ¥20 如何在 rocky9.4 部署 CDH6.3.2?
  • ¥35 navicat将excel中的数据导入mysql出错