Python用什么方法可以获取到Word文档里的批注内容?

Python用什么方法可以获取到Word文档里的批注。试过Python-docx好像没法获取批注。

2个回答

你好,我在 test.docx 文件中加了一个批注用来测试。使用下面的代码成功输出了我的批注。

from zipfile import ZipFile
from bs4 import BeautifulSoup

document=ZipFile('test.docx')
xml=document.read("word/comments.xml")
wordObj=BeautifulSoup(xml.decode("utf-8"), features="html.parser")
texts=wordObj.findAll("w:t")
for text in texts:
    print(text.text)

在解决这个问题时,我参考了这篇博客https://blog.csdn.net/qq_20183489/article/details/76736089
我解压文件后发现批注被保存在comments.xml文件里,稍微修改了一点该博客中的代码便输出了结果。希望可以帮到你。

baidu_38816076
方块海绵 很有帮助,感谢
大约一年之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
如何利用python将oracle 数据库表结构导出至word文档

如何利用python将oracle 数据库表结构导出至word文档

使用python语言,如何向word中添加word内部的图表?

我目前的的需求就是向一个word文档中插入一个饼图,该使用哪个包来实现? 个人目前是使用python-docx这个包来生成了word文档,但是这个包貌似没有生成图表的方法,求指点 备注:这里插入的饼图需要是一个图表chart,而不是一个picture图片

python3读取word文件报错

运行时,AttributeError: 'NoneType' object has no attribute 'paragraphs'的错误,请大佬解决一下。 ``` # 读取word #coding=utf-8 import win32com import win32com.client def readWord(path): #调用系统word功能,可以处理doc和docx文件 mw= win32com.client.Dispatch('Word.Application') # 打开文件 doc=mw.Documents.Open(path) for paragraph in doc.paragraphs: line=paragraph.Range.Text print(line) # 关闭文件 doc.close() # 退出word mw.Quit() path=r'‪C:\Users\cuichuang1\Desktop\aaa.docx' readWord(path) ```

怎么用python_docx提取docx的一级标题,二级标题?

需要将一份docx文档中文字,按照正文,一级标题,二级标题,页眉,页脚这些分类,将内容提取出来,生成为python对象,这个要怎么搞啊? 如果有大佬知道,麻烦可以给我讲一下么? 或者点拨我一下也可以? 麻烦了

python 怎么获取request 中 body的内容

python 怎么获取request 请求中 body的内容? 谢谢 就是红框中的内容 ![图片说明](https://img-ask.csdn.net/upload/201905/10/1557479798_54096.png) 这是工具里模拟发送的,上图红框中的内容,是写在下面request body里的东西 ![图片说明](https://img-ask.csdn.net/upload/201905/10/1557479812_304027.png) 但是在python里模拟请求时,因为有ud的值是每次登陆时都变一次。 所以想怎么能在它本身发送request时把body里的内容保存下来。 这样就可以取出里面的ud值 使用 这样不知道我表述明白没。我也是在学习阶段。希望指教

关于百度富文本编辑器自动生成word文档的问题

我使用ueditor文本编辑器将编辑的内容以html格式传入了数据库,我通过mht转ftl做了一个模板 ,然后在模板里面也添加了变量。我在运行的过程中模板也能够自动生成,里面的内容也能够完整显示出来。在生成的word里面能够看到图片占了位置,可是图片内容却显示不出来,我做了测试,我把之前图片转码成base64位的数据拿出来之后,再通过转码能够生成图片,就是在word文档里面显示不出来。不知道这是什么原因。还有就是word文档里面的标点符号会出现乱码,在wps里面能够完美兼容。不知道有没有人遇到过这样的问题

关于Python 操作Word的问题

各位大神,我最近在帮我们科室写一些应用程序。我用的语言是Python。 我遇到了一个问题,网上没找到答案,希望各位帮下忙。 我希望在Word文档中,生成下面这个表格,不知道有没有办法坐等,希望各位大神帮帮忙。 截图如下: ![图片说明](https://img-ask.csdn.net/upload/201504/30/1430384035_298689.png)

python爬虫中用xpath总是获取不到内容,希望大家帮我看看这两个网页中所需内容如何定位?谢谢~

用python爬虫,代码用xpath总是获取不到内容,希望大家帮我看看这两个网页中所需内容如何定位? 1.想要获取下面网址中的 债券基本信息 ,试了很多xpath的路径都失败了,都是空的_(¦3」∠)_,下面贴出测试用的代码,希望大家能帮我看下xpath那部分为什么不对(倒数第二行),也可能是其他问题o(╥﹏╥)o ``` import requests from lxml import html url = 'http://www.chinamoney.com.cn/chinese/zqjc/?bondDefinedCode=1000040278' page = requests.Session().get(url) tree = html.fromstring(page.text) result = tree.xpath('//tbody//tr//th/text()') print(result) ``` 2.想要获取下面网址中的一个href属性 (截图中阴影部分,就是查询结果的网址),也试了很多xpath的路径也都失败了,不知道@href前应该写什么。 ![图片说明](https://img-ask.csdn.net/upload/201903/27/1553648799_758977.png) ``` url = 'http://www.chinamoney.com.cn/chinese/qwjsn/?searchValue=14中关村集MTN001' ``` 第一次提问,有什么不合适的希望谅解,工作需要,时间比较急切,麻烦大家了。━((*′д`)爻(′д`*))━!!!!

Pixiv.net上通过XPath Helper可以准确获取到想要的,在Python里却无法获取到

![图片说明](https://img-ask.csdn.net/upload/201804/06/1523002838_927142.png) 网址为https://www.pixiv.net/search.php?s_mode=s_tag&word=%E3%83%8A%E3%83%AB%E3%83%88%20OR%20(%20Naruto%20)&order=popular_d 我发现F12查看到的和右键查看到的源代码不一样,Python里返回的是右键查看到的。我该怎么做才能提取到我想要的“/member_illust.php?mode=medium&illust_id=47221440”? # 获取返回页面数值 page_html = requests.get(html, headers=headers) # 将html的div 转化为 xml xmlcontent = etree.HTML(page_html.text) # 解析HTML文档为HTML DOM模型 # 返回所有匹配成功的列表集合 link_list = xmlcontent.xpath('//div[@class="layout-body"]//div[@class="_25taFA4"]//a[@class="gtm-recommend-illust gtm-thumbnail-link _1wlaFo6"]/@href') # 直接提取第一个href for link in link_list: print(link)

怎样用python获取安卓手机粘贴板的内容,然后输出到excel啊?

怎样用python获取安卓手机粘贴板的内容,然后输出到excel啊?

如何将编辑框的内容保存到word模板文档指定位置

VS2010下word操作(C++),如何将编辑框的内容保存到word模板文档的指定位置

python 3.7引用docx操作word文档报错exception 该怎么办?

我的是ubuntu系统 按照网上的其他说法下载了python__docx-0.8.7-py2.py3-none-any.whl 可是在终端上执行命令:pip3 install python_docx-0.8.10-py2.py3-none-any-i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com 又报错: Cannot unpack file /tmp/pip-unpack-x4ntu6_w/simple.htm (downloaded from /tmp/pip-req-build-rhoda3ha, content-type: text/html); cannot detect archive format Cannot determine archive format of /tmp/pip-req-build-rhoda3ha 各路大神帮帮忙阿

如何使用python读取docx文件,然后将里面的所有数据图,复制粘贴到新文件中?

尝试过很多办法,python-docx,pywin32都尝试过,但都没能实现。难点在于,docx文件里的图是用excel作的那种,结构都是散的,如果是单张图片,复制粘贴很简单。但这种excel生成的图,就很头大了,不知道有没有办法,将这个图转成PNG或者JPG格式,又或者不转格式,直接带着格式复制粘贴到某个新的word文档中呢?希望各位大神指点迷津下吧!

如何使用python的docx模块,获取指定段落后的表格

在使用python中的docx模块解析.docx文件时, 发现只能使用 .paragraphs/ .tables 来分别获取docx的所有段落或者所有表格。 可以按照顺序获取段落,和段落后的表格吗? 或者怎么可以获取指定段落后的表格呢???

python 3.7引用docx操作word文档报错exception

python 3.7引用docx操作word文档报错“docx.opc.exceptions.PackageNotFoundError: Package not found at.....”,网上搜的方法都尝试过了,没有用。python__docx-0.8.6-py2.py3-none-any.whl这个包已经没有了,下载了python__docx-0.8.7-py2.py3-none-any.whl。但是仍然报错。求大神帮忙,给个终极解决办法。

Qt导出word文档,如何在代码中设置文档内容的样式?

RT。网上查了一下,基本都是用模板+书签的方法来插入内容,但是我现在想直接靠运行程序来生成一个文档,但是这就有一个问题,文档内容的格式就得写在代码之中,而不能像书签那样把格式定好了直接插内容就行。各位大神知道怎么弄吗?

python正则表达式提取word中问答的答案

二、调查内容: 1、你的性格特征是?(C)(单选) A. 性格外向、喜欢与人沟通 B. 内向,不喜欢主动与人沟通 C. 有时外向,有时内向 D. 不知道自己的性格 2、您认为大学生毕业生为什么要参与实习(ABC)(多选) A、加深对职业与行业的了解,确认喜欢或擅长的职业 B、提高为人处世能力,为从学生向职场人士转变做准备 C、积累社会实践和经验 D、完成学校要求 E、赚钱

Python 爬虫为什么只爬取到一个html页中的部分内容。

在用Python中urlopen和read直接获取到一个网页的HTML,为什么内容与通过浏览器的 查看网页源码的方式显示内容不一样呢,获取到的HTML只有原HTML部分内容。

求一个能够自动把WORD试卷文档导进去成为一道一道的题,保存为数据库

就是说,假设 有许多个WORD文档试卷,现在想把其中的每一道题目都自动识别出来导入到数据库中保存,这样就方便于制作 试题考试系统或在线考试平台。有没有这样的智能化的软件,能够实现高识别率,而且能够将WORD中的公式和图片等自动上传到服务器后生成HTML格式的样式的(方便网络在线题库平台使用)。我发现目前的一些主流平台及工具都要求事先将WORD文档的题干和选项等作标记或必须按指定的格式先修改好,那么多(上万个WORD文档试卷),这样修改太辛苦了,有没有不用修改原WORD文档就直接能智能识别导入任何题型任何题目的工具软件?有源代码就更好!

在中国程序员是青春饭吗?

今年,我也32了 ,为了不给大家误导,咨询了猎头、圈内好友,以及年过35岁的几位老程序员……舍了老脸去揭人家伤疤……希望能给大家以帮助,记得帮我点赞哦。 目录: 你以为的人生 一次又一次的伤害 猎头界的真相 如何应对互联网行业的「中年危机」 一、你以为的人生 刚入行时,拿着傲人的工资,想着好好干,以为我们的人生是这样的: 等真到了那一天,你会发现,你的人生很可能是这样的: ...

程序员请照顾好自己,周末病魔差点一套带走我。

程序员在一个周末的时间,得了重病,差点当场去世,还好及时挽救回来了。

Java基础知识面试题(2020最新版)

文章目录Java概述何为编程什么是Javajdk1.5之后的三大版本JVM、JRE和JDK的关系什么是跨平台性?原理是什么Java语言有哪些特点什么是字节码?采用字节码的最大好处是什么什么是Java程序的主类?应用程序和小程序的主类有何不同?Java应用程序与小程序之间有那些差别?Java和C++的区别Oracle JDK 和 OpenJDK 的对比基础语法数据类型Java有哪些数据类型switc...

和黑客斗争的 6 天!

互联网公司工作,很难避免不和黑客们打交道,我呆过的两家互联网公司,几乎每月每天每分钟都有黑客在公司网站上扫描。有的是寻找 Sql 注入的缺口,有的是寻找线上服务器可能存在的漏洞,大部分都...

Intellij IDEA 实用插件安利

1. 前言从2020 年 JVM 生态报告解读 可以看出Intellij IDEA 目前已经稳坐 Java IDE 头把交椅。而且统计得出付费用户已经超过了八成(国外统计)。IDEA 的...

搜狗输入法也在挑战国人的智商!

故事总是一个接着一个到来...上周写完《鲁大师已经彻底沦为一款垃圾流氓软件!》这篇文章之后,鲁大师的市场工作人员就找到了我,希望把这篇文章删除掉。经过一番沟通我先把这篇文章从公号中删除了...

总结了 150 余个神奇网站,你不来瞅瞅吗?

原博客再更新,可能就没了,之后将持续更新本篇博客。

副业收入是我做程序媛的3倍,工作外的B面人生是怎样的?

提到“程序员”,多数人脑海里首先想到的大约是:为人木讷、薪水超高、工作枯燥…… 然而,当离开工作岗位,撕去层层标签,脱下“程序员”这身外套,有的人生动又有趣,马上展现出了完全不同的A/B面人生! 不论是简单的爱好,还是正经的副业,他们都干得同样出色。偶尔,还能和程序员的特质结合,产生奇妙的“化学反应”。 @Charlotte:平日素颜示人,周末美妆博主 大家都以为程序媛也个个不修边幅,但我们也许...

MySQL数据库面试题(2020最新版)

文章目录数据库基础知识为什么要使用数据库什么是SQL?什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式?分别有什么区别?数据类型mysql有哪些数据类型引擎MySQL存储引擎MyISAM与InnoDB区别MyISAM索引与InnoDB索引的区别?InnoDB引擎的4大特性存储引擎选择索引什么是索引?索引有哪些优缺点?索引使用场景(重点)...

如果你是老板,你会不会踢了这样的员工?

有个好朋友ZS,是技术总监,昨天问我:“有一个老下属,跟了我很多年,做事勤勤恳恳,主动性也很好。但随着公司的发展,他的进步速度,跟不上团队的步伐了,有点...

我入职阿里后,才知道原来简历这么写

私下里,有不少读者问我:“二哥,如何才能写出一份专业的技术简历呢?我总感觉自己写的简历太烂了,所以投了无数份,都石沉大海了。”说实话,我自己好多年没有写过简历了,但我认识的一个同行,他在阿里,给我说了一些他当年写简历的方法论,我感觉太牛逼了,实在是忍不住,就分享了出来,希望能够帮助到你。 01、简历的本质 作为简历的撰写者,你必须要搞清楚一点,简历的本质是什么,它就是为了来销售你的价值主张的。往深...

魂迁光刻,梦绕芯片,中芯国际终获ASML大型光刻机

据羊城晚报报道,近日中芯国际从荷兰进口的一台大型光刻机,顺利通过深圳出口加工区场站两道闸口进入厂区,中芯国际发表公告称该光刻机并非此前盛传的EUV光刻机,主要用于企业复工复产后的生产线扩容。 我们知道EUV主要用于7nm及以下制程的芯片制造,光刻机作为集成电路制造中最关键的设备,对芯片制作工艺有着决定性的影响,被誉为“超精密制造技术皇冠上的明珠”,根据之前中芯国际的公报,目...

优雅的替换if-else语句

场景 日常开发,if-else语句写的不少吧??当逻辑分支非常多的时候,if-else套了一层又一层,虽然业务功能倒是实现了,但是看起来是真的很不优雅,尤其是对于我这种有强迫症的程序"猿",看到这么多if-else,脑袋瓜子就嗡嗡的,总想着解锁新姿势:干掉过多的if-else!!!本文将介绍三板斧手段: 优先判断条件,条件不满足的,逻辑及时中断返回; 采用策略模式+工厂模式; 结合注解,锦...

离职半年了,老东家又发 offer,回不回?

有小伙伴问松哥这个问题,他在上海某公司,在离职了几个月后,前公司的领导联系到他,希望他能够返聘回去,他很纠结要不要回去? 俗话说好马不吃回头草,但是这个小伙伴既然感到纠结了,我觉得至少说明了两个问题:1.曾经的公司还不错;2.现在的日子也不是很如意。否则应该就不会纠结了。 老实说,松哥之前也有过类似的经历,今天就来和小伙伴们聊聊回头草到底吃不吃。 首先一个基本观点,就是离职了也没必要和老东家弄的苦...

2020阿里全球数学大赛:3万名高手、4道题、2天2夜未交卷

阿里巴巴全球数学竞赛( Alibaba Global Mathematics Competition)由马云发起,由中国科学技术协会、阿里巴巴基金会、阿里巴巴达摩院共同举办。大赛不设报名门槛,全世界爱好数学的人都可参与,不论是否出身数学专业、是否投身数学研究。 2020年阿里巴巴达摩院邀请北京大学、剑桥大学、浙江大学等高校的顶尖数学教师组建了出题组。中科院院士、美国艺术与科学院院士、北京国际数学...

为什么你不想学习?只想玩?人是如何一步一步废掉的

不知道是不是只有我这样子,还是你们也有过类似的经历。 上学的时候总有很多光辉历史,学年名列前茅,或者单科目大佬,但是虽然慢慢地长大了,你开始懈怠了,开始废掉了。。。 什么?你说不知道具体的情况是怎么样的? 我来告诉你: 你常常潜意识里或者心理觉得,自己真正的生活或者奋斗还没有开始。总是幻想着自己还拥有大把时间,还有无限的可能,自己还能逆风翻盘,只不是自己还没开始罢了,自己以后肯定会变得特别厉害...

百度工程师,获利10万,判刑3年!

所有一夜暴富的方法都写在刑法中,但总有人心存侥幸。这些年互联网犯罪高发,一些工程师高技术犯罪更是引发关注。这两天,一个百度运维工程师的案例传遍朋友圈。1...

程序员为什么千万不要瞎努力?

本文作者用对比非常鲜明的两个开发团队的故事,讲解了敏捷开发之道 —— 如果你的团队缺乏统一标准的环境,那么即使勤劳努力,不仅会极其耗时而且成果甚微,使用...

为什么程序员做外包会被瞧不起?

二哥,有个事想询问下您的意见,您觉得应届生值得去外包吗?公司虽然挺大的,中xx,但待遇感觉挺低,马上要报到,挺纠结的。

当HR压你价,说你只值7K,你该怎么回答?

当HR压你价,说你只值7K时,你可以流畅地回答,记住,是流畅,不能犹豫。 礼貌地说:“7K是吗?了解了。嗯~其实我对贵司的面试官印象很好。只不过,现在我的手头上已经有一份11K的offer。来面试,主要也是自己对贵司挺有兴趣的,所以过来看看……”(未完) 这段话主要是陪HR互诈的同时,从公司兴趣,公司职员印象上,都给予对方正面的肯定,既能提升HR的好感度,又能让谈判气氛融洽,为后面的发挥留足空间。...

面试:第十六章:Java中级开发(16k)

HashMap底层实现原理,红黑树,B+树,B树的结构原理 Spring的AOP和IOC是什么?它们常见的使用场景有哪些?Spring事务,事务的属性,传播行为,数据库隔离级别 Spring和SpringMVC,MyBatis以及SpringBoot的注解分别有哪些?SpringMVC的工作原理,SpringBoot框架的优点,MyBatis框架的优点 SpringCould组件有哪些,他们...

面试阿里p7,被按在地上摩擦,鬼知道我经历了什么?

面试阿里p7被问到的问题(当时我只知道第一个):@Conditional是做什么的?@Conditional多个条件是什么逻辑关系?条件判断在什么时候执...

无代码时代来临,程序员如何保住饭碗?

编程语言层出不穷,从最初的机器语言到如今2500种以上的高级语言,程序员们大呼“学到头秃”。程序员一边面临编程语言不断推陈出新,一边面临由于许多代码已存在,程序员编写新应用程序时存在重复“搬砖”的现象。 无代码/低代码编程应运而生。无代码/低代码是一种创建应用的方法,它可以让开发者使用最少的编码知识来快速开发应用程序。开发者通过图形界面中,可视化建模来组装和配置应用程序。这样一来,开发者直...

面试了一个 31 岁程序员,让我有所触动,30岁以上的程序员该何去何从?

最近面试了一个31岁8年经验的程序猿,让我有点感慨,大龄程序猿该何去何从。

大三实习生,字节跳动面经分享,已拿Offer

说实话,自己的算法,我一个不会,太难了吧

程序员垃圾简历长什么样?

已经连续五年参加大厂校招、社招的技术面试工作,简历看的不下于万份 这篇文章会用实例告诉你,什么是差的程序员简历! 疫情快要结束了,各个公司也都开始春招了,作为即将红遍大江南北的新晋UP主,那当然要为小伙伴们做点事(手动狗头)。 就在公众号里公开征简历,义务帮大家看,并一一点评。《启舰:春招在即,义务帮大家看看简历吧》 一石激起千层浪,三天收到两百多封简历。 花光了两个星期的所有空闲时...

《Oracle Java SE编程自学与面试指南》最佳学习路线图2020年最新版(进大厂必备)

正确选择比瞎努力更重要!

字节跳动面试官竟然问了我JDBC?

轻松等回家通知

面试官:你连SSO都不懂,就别来面试了

大厂竟然要考我SSO,卧槽。

实时更新:计算机编程语言排行榜—TIOBE世界编程语言排行榜(2020年6月份最新版)

内容导航: 1、TIOBE排行榜 2、总榜(2020年6月份) 3、本月前三名 3.1、C 3.2、Java 3.3、Python 4、学习路线图 5、参考地址 1、TIOBE排行榜 TIOBE排行榜是根据全世界互联网上有经验的程序员、课程和第三方厂商的数量,并使用搜索引擎(如Google、Bing、Yahoo!)以及Wikipedia、Amazon、YouTube统计出排名数据。

立即提问
相关内容推荐