怎么用python_docx提取docx的一级标题，二级标题？

需要将一份docx文档中文字，按照正文，一级标题，二级标题，页眉，页脚这些分类，将内容提取出来，生成为python对象，这个要怎么搞啊？
如果有大佬知道，麻烦可以给我讲一下么？
或者点拨我一下也可以？
麻烦了

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
weixin_40801296 2019-04-25 01:51
关注
file = Document(path)
para = 段落编号
输入：

print(file.paragraphs[para].style.name)

输出：Heading 2
标题一览表可参见：https://python-docx.readthedocs.io/en/latest/api/enum/WdBuiltinStyle.html
解决 2

无用 3
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python使用python-docx模块读取word表格发生重复 python
2021-03-05 23:08

回答 4 已采纳遍历的时候有意识去重就可以了 value_list = list() for row in table.rows: temp = list() for cell in row.ce
python-docx遍历删除所有图片 python
2022-07-08 09:33

回答 3 已采纳 from docx import Document doc_save = '/home/john/Downloads/20220630.docx' doc = Document(doc_save)
wxpython和python-docx不兼容吗？ python 有问必答
2021-05-10 19:29

回答 5 已采纳代码没有问题，运行结果正常，测试环境python3.7.6,docx0.8.10,wx4.1.0
python_docx-0.8.10-py2.py3-none-any.whl
2019-05-08 15:39

估计这个安装包还只兼容python 2(python2 和python3差别还是挺大的，虽然现在python 3出来很久了，但是不少三方库还没有更新)，因此需要自己找一个兼容的包：python_docx-0.8.6-py2.py3-none-any.whl。然后在...
python 模块docx问题：如何调整整体word文档的字体大小，和如何单独设置标题字体大小和字体模式，以及居中设置。 python 有问必答
2021-09-06 20:32

回答 2 已采纳参考一下官方文档: python-docx — python-docx 0.8.11 documentation https://pyt
如何使用python的docx模块，获取指定段落后的表格 python
2019-08-06 16:49

回答 1 已采纳应该没有这样的method，可以workaround介绍给你： https://github.com/python-openxml/python-docx/issues/40
python-docx模块无法导入 python
2022-08-21 15:58

回答 3 已采纳直接打开pycharm 命令行，就是这里：输入下面命令： pip install python-docx -i http://pypi.douban.com/simple --trusted-ho
Python-docx三方库安装包
2022-10-03 12:25

Python-docx三方库安装包，Liunx和Windows系统通用
请问pythondocx库如何将表格单元格中的文字纵向显示 python 有问必答
2021-12-16 13:32

回答 1 已采纳可以试试单元格字段用换行符分隔。:table.cell(0, 0).text='\n'.join(list('学生成绩')) from docx.enum.table import WD_TABLE_
python docx模块问题：如何设置word文档的段落距离大小？ python 有问必答
2021-09-06 20:56

回答 2 已采纳参考这个
怎么通过python docx设置word单元格颜色 python
2022-08-25 14:17

回答 2 已采纳文章：利用Python docx修改word关键词颜色中也许有你想要的答案，请看下吧
docx_python_process：从docx文件中批量提取图片表格内文字
2021-02-11 15:54

docx_python_process 从docx文件中批量提取图片表格内文字 pip安装： pip install python-docx
【python-docx】学习python-docx，想提取文字后分类别存入不同word，出现错误 python
2021-11-11 23:16

回答 1 已采纳估计是代码输入有错误了
python_docx&docxtpl.rar
2020-02-22 12:14

安装python-docx-template最新版本为 docxtpl-0.6.3-py2.py3-none-any.whl，该库包依赖 python-docx-0.8.7.tar.gz，现在网络限制问题，下载时断时续，几兆的东西用半天，上传提供方便！
docx2Excel_Pythonword_python_提取wordexcel_源码
2021-10-04 02:15

通过Python实现把word中的文字提取至Excel中
没有解决我的问题, 去提问

悬赏问题

¥15 用visual studi code完成html页面
¥15 聚类分析或者python进行数据分析
¥15 逻辑谓词和消解原理的运用
¥15 三菱伺服电机按启动按钮有使能但不动作
¥15 js，页面2返回页面1时定位进入的设备
¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
¥15 （希望可以解决问题）ma和mb文件无法正常打开，打开后是空白，但是有正常内存占用，但可以在打开Maya应用程序后打开场景ma和mb格式。
¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
¥20 腾讯企业邮箱邮件可以恢复么
¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗？