woqunina 2022-01-14 23:13 采纳率: 100%
浏览 110
已结题

如何利用python提取word中部分段落并另存?

一个word中有3部分,我想把后面2部分提取出来,并且第3和2部分互换一下,保存成新的word,如下图,左侧是原word, 右侧为目标word。

img

我计划的思路:
调用python-docx,3部分用6个paragraph表示,按照输出5,6,3,4段的顺序输出,
from docx import Document
doc = Document('g:/python/0.docx')
P0 = doc.paragraphs[0]
P1 = doc.paragraphs[1]
P2 = doc.paragraphs[2]
P3 = doc.paragraphs[3]
P4 = doc.paragraphs[4]
P5 = doc.paragraphs[5]
print(P4.text)
print(P5.text)
print(P2.text)
print(P3.text)
doc.save('g:/python/11.docx')
运行的时候可以实现,但是保存的文件和原文件一样。
我应该怎么改,谢谢!!

  • 写回答

2条回答 默认 最新

  • CSDN专家-HGJ 2022-01-15 00:32
    关注

    代码中只是读取了段落,并没有写入新的文档中,对于五号字体取Pt(10.5)*2首先缩进。使用如下代码即可:

    from docx import Document
    from docx.shared import Cm, Pt
    doc = Document('t0115.docx')
    doc1=Document()
    P0 = doc.paragraphs[0]
    P1 = doc.paragraphs[1]
    P2 = doc.paragraphs[2]
    P3 = doc.paragraphs[3]
    P4 = doc.paragraphs[4]
    P5 = doc.paragraphs[5]
    doc1.add_paragraph(P4.text,style='Heading 1')
    a1=doc1.add_paragraph(P5.text)
    a1.paragraph_format.first_line_indent = Pt(10.5)* 2
    doc1.add_paragraph(P2.text, style='Heading 1')
    a2=doc1.add_paragraph(P3.text)
    a2.paragraph_format.first_line_indent = Pt(10.5) * 2
    doc1.save('t0115_1.docx')
    

    如有帮助,请点采纳按钮支持。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 1月23日
  • 已采纳回答 1月15日
  • 创建了问题 1月14日

悬赏问题

  • ¥15 救!ENVI5.6深度学习初始化模型报错怎么办?
  • ¥30 eclipse开启服务后,网页无法打开
  • ¥30 雷达辐射源信号参考模型
  • ¥15 html+css+js如何实现这样子的效果?
  • ¥15 STM32单片机自主设计
  • ¥15 如何在node.js中或者java中给wav格式的音频编码成sil格式呢
  • ¥15 不小心不正规的开发公司导致不给我们y码,
  • ¥15 我的代码无法在vc++中运行呀,错误很多
  • ¥50 求一个win系统下运行的可自动抓取arm64架构deb安装包和其依赖包的软件。
  • ¥60 fail to initialize keyboard hotkeys through kernel.0000000000