woqunina 2022-01-14 23:13 采纳率: 100%
浏览 110
已结题

如何利用python提取word中部分段落并另存?

一个word中有3部分,我想把后面2部分提取出来,并且第3和2部分互换一下,保存成新的word,如下图,左侧是原word, 右侧为目标word。

img

我计划的思路:
调用python-docx,3部分用6个paragraph表示,按照输出5,6,3,4段的顺序输出,
from docx import Document
doc = Document('g:/python/0.docx')
P0 = doc.paragraphs[0]
P1 = doc.paragraphs[1]
P2 = doc.paragraphs[2]
P3 = doc.paragraphs[3]
P4 = doc.paragraphs[4]
P5 = doc.paragraphs[5]
print(P4.text)
print(P5.text)
print(P2.text)
print(P3.text)
doc.save('g:/python/11.docx')
运行的时候可以实现,但是保存的文件和原文件一样。
我应该怎么改,谢谢!!

  • 写回答

2条回答 默认 最新

  • CSDN专家-HGJ 2022-01-15 00:32
    关注

    代码中只是读取了段落,并没有写入新的文档中,对于五号字体取Pt(10.5)*2首先缩进。使用如下代码即可:

    from docx import Document
    from docx.shared import Cm, Pt
    doc = Document('t0115.docx')
    doc1=Document()
    P0 = doc.paragraphs[0]
    P1 = doc.paragraphs[1]
    P2 = doc.paragraphs[2]
    P3 = doc.paragraphs[3]
    P4 = doc.paragraphs[4]
    P5 = doc.paragraphs[5]
    doc1.add_paragraph(P4.text,style='Heading 1')
    a1=doc1.add_paragraph(P5.text)
    a1.paragraph_format.first_line_indent = Pt(10.5)* 2
    doc1.add_paragraph(P2.text, style='Heading 1')
    a2=doc1.add_paragraph(P3.text)
    a2.paragraph_format.first_line_indent = Pt(10.5) * 2
    doc1.save('t0115_1.docx')
    

    如有帮助,请点采纳按钮支持。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 1月23日
  • 已采纳回答 1月15日
  • 创建了问题 1月14日

悬赏问题

  • ¥15 django项目运行报编码错误
  • ¥15 请问这个是什么意思?
  • ¥15 STM32驱动继电器
  • ¥15 Windows server update services
  • ¥15 关于#c语言#的问题:我现在在做一个墨水屏设计,2.9英寸的小屏怎么换4.2英寸大屏
  • ¥15 模糊pid与pid仿真结果几乎一样
  • ¥15 java的GUI的运用
  • ¥15 我想付费需要AKM公司DSP开发资料及相关开发。
  • ¥15 怎么配置广告联盟瀑布流
  • ¥15 Rstudio 保存代码闪退