珂朵莉树 2023-01-11 22:19 采纳率: 57.1%
浏览 54

python-docx删除段落

问题遇到的现象和发生背景

购买了一个英语题集,题目数量很多,是电子版docx格式,但是其中每一题下面都有译文和答案,希望删除

用代码块功能插入代码,请勿粘贴截图。 不用代码块回答率下降 50%
import docx
import os
from docx import Document
file=docx.Document("C://Users//苏江婉//Desktop//学习//学科//英语//ABC.docx")
def delWordContent(docx_file='',dest_file=''):
    doc=Document(docx_file)
    paragraphs=doc.paragraphs
def delete_paragraph(paragraph):
    p = paragraph._element
    p.getparent().remove(p)
    paragraph._p = paragraph._element = None
    if text.startswith("答案",0,3) is True:
        delete.paragraph(p)
    else:
        doc.save(dest_file)
        delWordContent(docx_file='C://Users//苏江婉//Desktop//学习//学科//英语//ABC.docx',dest_file='C://Users//苏江婉//Desktop//学习//学科//英语//ABC[已完成].docx')


运行结果及详细报错内容 查看文件属性,它没有保存,可能是循环中有错误,但是没有报错
我的解答思路和尝试过的方法,不写自己思路的,回答率下降 60% 我是调用了python-docx,通过关键词定位进而删除段落
我想要达到的结果,如果你需要快速回答,请尝试 “付费悬赏” 通过关键词定位进而删除段落
  • 写回答

1条回答 默认 最新

  • 流比 2023-01-11 22:36
    关注
    
    import docx
    from docx import Document
    
    def del_answer_paragraph(docx_file, dest_file):
        doc = Document(docx_file)
        paragraphs = doc.paragraphs
        for paragraph in paragraphs:
            if "答案" in paragraph.text:
                doc.paragraphs.remove(paragraph)
        doc.save(dest_file)
    
    del_answer_paragraph("C://Users//苏江婉//Desktop//学习//学科//英语//ABC.docx","C://Users//苏江婉//Desktop//学习//学科//英语//ABC[已完成].docx")
    
    
    评论

报告相同问题?

问题事件

  • 创建了问题 1月11日

悬赏问题

  • ¥20 matlab写的上位机UDP速率不到1M
  • ¥100 tomcat应用从Termux上连接不到Linux上的MySQL服务器(相关搜索:服务器)
  • ¥15 flutter 错误RROR:flutter/runtime/dart_vm_initializer.cc(41)
  • ¥15 python和aspen Adsportion交互
  • ¥20 dat文件如何识别真假(语言-python)
  • ¥20 打开谷歌浏览器使用摄像头进行人脸认证登录,系统提示检测到多个摄像头设备疑似攻击,请重新验证。
  • ¥50 服务器被挂外链急需解决
  • ¥15 C语言方阵最基本的氩气放电等离子体鞘层
  • ¥15 QWebEngineView
  • ¥15 docker启动报错,如何解决?(操作系统-linux)