poi解析docx中图片位图问题

怎样通过poi获得word 2007以上版本中图片的位置,然后将图片的位置换成文本字样“图片 输出成字符串

1个回答

lmn930517
LuckiessDream 我要的是word 中 docx 格式的 ,不是ppt
2 年多之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
如何使用poi将docx生存xml
如何使用poi将docx生存xml, 目的是为了生产xml然后用free marker写入数据。
如何使用POI删除docx文件中的所有批注信息,跪谢,大神们帮帮忙。不胜感激!谢谢。 答对悬赏
如何使用POI删除docx文件中的所有批注信息,跪谢,大神们帮帮忙。不胜感激!谢谢。
java poi解析office(包括ppt,pptx,doc,docx,xsl,xslx)
java poi解析office(包括ppt,pptx,doc,docx,xsl,xslx)内容,字体,样式和图片的位置,请问各位有没有类似的经验,麻烦知道的大侠给小弟讲讲,感激不尽!!!
如何用POI或docx4j向word表格中的单元格插入多张图片
``` public void addPictureToWord() throws Exception{ // 模板文件路径 String templatePath = "E:\\POIToWord.docx"; // 生成的文件路径 String targetPath = "E:\\target.docx"; // 书签名 String bookmarkName = "picture"; // 图片路径 String imagePath = "E:\\timg.png"; String imagePath1 = "E:\\timg1.png"; // 载入模板文件 WordprocessingMLPackage wPackage = WordprocessingMLPackage.load(new FileInputStream(templatePath)); // 提取正文 MainDocumentPart mainDocumentPart = wPackage.getMainDocumentPart(); Document wmlDoc = (Document) mainDocumentPart.getJaxbElement(); Body body = wmlDoc.getBody(); // 提取正文中所有段落 List<Object> paragraphs = body.getContent(); // 提取书签并创建书签的游标 RangeFinder rt = new RangeFinder("CTBookmark", "CTMarkupRange"); new TraversalUtil(paragraphs, rt); // 遍历书签 for (CTBookmark bm:rt.getStarts()) { // 这儿可以对单个书签进行操作,也可以用一个map对所有的书签进行处理 if (bm.getName().equals(bookmarkName)){ // 读入图片并转化为字节数组,因为docx4j只能字节数组的方式插入图片 InputStream is = new FileInputStream(imagePath); InputStream is1 = new FileInputStream(imagePath1); byte[] bytes = IOUtils.toByteArray(is); byte[] bytes1 = IOUtils.toByteArray(is1); byte[][] bss = {bytes,bytes1}; // 创建一个行内图片 BinaryPartAbstractImage imagePart = BinaryPartAbstractImage.createImagePart(wPackage, bss[0]); // BinaryPartAbstractImage imagePart1 = BinaryPartAbstractImage.createImagePart(wPackage, bss[1]); // createImageInline函数的前四个参数我都没有找到具体啥意思,,,, // 最有一个是限制图片的宽度,缩放的依据 Inline inline = imagePart.createImageInline(null, null, 0,1, false, 1200); // Inline inline1 = imagePart1.createImageInline(null, null, 0,1, false, 1200); // 获取该书签的父级段落 P p = (P)(bm.getParent()); ObjectFactory factory = new ObjectFactory(); // R对象是匿名的复杂类型,然而我并不知道具体啥意思 R run = factory.createR(); // drawing理解为画布? org.docx4j.wml.Drawing drawing = factory.createDrawing(); drawing.getAnchorOrInline().add(inline); // drawing.getAnchorOrInline().add(inline1); run.getContent().add(drawing); p.getContent().add(run); } } wPackage.save(new FileOutputStream(targetPath)); } 注释部分的代码是我自己后续添加的,想通过这样来实现同一个单元格插入多张图片的功能,结果。。。 变成了灾难性的故障。 希望各位大神帮帮忙修改一下代码! ```
POI解析Excel日期取值问题
使用POI解析Excel时,Excel中日期字段填入格式为“XX年XX月”,显示为自定义类型。在后台取值时得到的是一个数值,譬如输入“2012年8月”,后台取到的是45135之类的数值,而不是日期。如何取到日期呢?或者“2012年8月”的字符串?
使用POI替换.docx文件中的${reportDate}为指定值
word模板中有个段落如下: 报告日期:${reportDate} POI读取该段落后,使用XWPFParagraph对象的getRuns()方法却返回如下数组: [报告日期:, ${, reportDate, }] 而不是 [报告日期:, ${reportDate}] poi-3.7和poi-3.11都是这样,请问是哪里出了问题?
JAVA POI解析,JS或页面如果实时获取解析进度?
JAVA POI解析,JS或页面如果实时获取解析进度?就是实时的反馈结果到页面。。
用POI将docx文档转html
![图片说明](https://img-ask.csdn.net/upload/201605/27/1464333384_53.png) 为什么老是报 ![图片说明](https://img-ask.csdn.net/upload/201605/27/1464333505_459245.png) 这个错误呢?? 还有就是有人知道XWPFDocument可以转换该格式吗,行的话,如何转换。网上说XSSFWorkbook可以转,怎么转呀??知道的人给个代码,谢谢
POI解析word2007问题,如何解析其中插入的excel表格
在word2007中有插入的excel对象,利用POI怎么才能将其解析出来?求解!
java中如何使用poi3.10将docx文件转换成html文件预览
java中如何使用poi3.10将docx文件转换成html文件预览
用POI读取docx doc文档样式时,当文档用标题(一级标题.....),其全篇字体都会变成-1,请教大神原因。
问题描述:用POI读取docx doc文档样式时,当文档用标题(一级标题.....),其全篇字体都会变成-1,请教大神原因。 预想效果:能获取含标题文档的样式(字体 字号 颜色等) 代码: ``` import java.io.FileInputStream; import java.io.InputStream; import java.util.List; import org.apache.poi.xwpf.usermodel.XWPFDocument; import org.apache.poi.xwpf.usermodel.XWPFParagraph; import org.apache.poi.xwpf.usermodel.XWPFRun; public class XwpfTest{ public static void main(String[] args)throws Exception { InputStream is = new FileInputStream("D:\\test.docx"); @SuppressWarnings("resource") XWPFDocument doc = new XWPFDocument(is); List<XWPFParagraph> paras = doc.getParagraphs();//将得到包含段落列表 System.out.println("all data :" + paras.size()); for(XWPFParagraph para : paras) { //当前段落的属性   //CTPPr pr = para.getCTP().getPPr();  //System.out.println(para.getText()); List<XWPFRun> runsLists = para.getRuns();//获取段楼中的句列表 for(XWPFRun runsList : runsLists ){ String c = runsList.getColor();//获取句的字体颜色 float f = runsList.getFontSize();//获取句中字的大小 String s = runsList.getText(0);//获取文本内容 if(s != null) // 如果读取为非空,则对其进行判断 { if(s.contains("摘要"))// 识别摘要 { System.out.println("right!"); runsList.setBold(true); } if(s.equals("摘要:")){ System.out.println("ddddddddddddddddddd"); } if(s.contains("第一章")){ if(f != 16){ System.out.println("一级标题格式不是三号字体!"); } System.out.println("一级标题!!!!!"); } } System.out.println("color:" + c); System.out.println("size:" + f); System.out.print("text:" + s); if(s != null){ System.out.print(",the length of string is " + s.length()); } System.out.println("-----"); } } } } ``` test.docx文档图片 ![test.docx文档样式](https://img-ask.csdn.net/upload/201904/10/1554900595_421852.png) 运行图片: ![运行图片](https://img-ask.csdn.net/upload/201904/10/1554900733_620096.png)
java poi 将docx文件转html出现缺包问题 不知道缺少哪一个包
![图片说明](https://img-ask.csdn.net/upload/201706/30/1498782807_697406.png)
java中如何使用poi3.10将docx文件转换成html文件?
java 中poi3.10怎么读取docx版本的文档为html
poi读取通过xml方式修改过的docx出错。
我通过zip4j解压docx文件,修改里面的ducomen.xml来改变docx的内容。当我重新把改完的文件经行压缩后,POI读取docx文件时报错: Exception in thread "main" java.io.IOException: Failed to read zip entry source at org.apache.poi.openxml4j.opc.ZipPackage.<init>(ZipPackage.java:103) at org.apache.poi.openxml4j.opc.OPCPackage.open(OPCPackage.java:324) at org.apache.poi.util.PackageHelper.open(PackageHelper.java:37) at org.apache.poi.xwpf.usermodel.XWPFDocument.<init>(XWPFDocument.java:116) at test.Test1.test(Test1.java:36) at test.Test1.main(Test1.java:29) Caused by: java.util.zip.ZipException: only DEFLATED entries can have EXT descriptor at java.util.zip.ZipInputStream.readLOC(ZipInputStream.java:310) at java.util.zip.ZipInputStream.getNextEntry(ZipInputStream.java:122) at org.apache.poi.openxml4j.util.ZipSecureFile$ThresholdInputStream.getNextEntry(ZipSecureFile.java:280) at org.apache.poi.openxml4j.util.ZipInputStreamZipEntrySource.<init>(ZipInputStreamZipEntrySource.java:52) at org.apache.poi.openxml4j.opc.ZipPackage.<init>(ZipPackage.java:100) ... 5 more ** zip4j的压缩代码:** ``` ZipFile zipFile = new ZipFile(zipPath); ZipParameters parameters = new ZipParameters(); parameters.setCompressionMethod(Zip4jConstants.COMP_DEFLATE); parameters.setCompressionLevel(Zip4jConstants.DEFLATE_LEVEL_NORMAL); parameters.setIncludeRootFolder(false); zipFile.addFolder(dirPath, parameters); ``` **读取docx的代码:** ``` XWPFWordExtractor extractor = new XWPFWordExtractor(new XWPFDocument(new FileInputStream(new File(f)))); System.out.println(extractor.getText()); ``` f为文件路径 我通过WPS打开这个docx是没问题的,但是使用POI来读取的就会报错,错误信息是在看不懂不知道有大佬知道吗?
poi word转html图片大小问题
poi word转html时读取word中的图片读取的是原图大小,我要的是word中缩放之后的 大小,代码应该怎么写
poi解析excel报XmlValueDisconnectedException
因为XSSFWorkbook workbook = new XSSFWorkbook(sbs);执行很慢,我就在类中定义了一个成员变量workbook,workbook = new XSSFWorkbook(sbs);只执行一次,在另一个方法中直接使用workbook来解析excel,但到解析公式的时报XmlValueDisconnectedException。如果我在解析公式的方法中再重新申明XSSFWorkbook workbook1 = new XSSFWorkbook(sbs);就不报错了,这是为什么?求解答
poi word转html 图片问题
![图片说明](https://img-ask.csdn.net/upload/201701/04/1483519381_871484.png) word上画的图转不了 poi word转html 图片大小和word上图片大小不一致
poi解析excel,里面sex的值只能为1或2
poi解析excel,里面sex的值只能为1或2,如果我写成其他数字或字母 解析后还是会保存到数据库,怎么判断一下呢
POI解析excel问题
WorkbookFactory.create(FileInputStream) 这个方法读取2003的文件没问题 读取2007版本的 不抛异常 也读不出来 是什么情况?
相见恨晚的超实用网站
相见恨晚的超实用网站 持续更新中。。。
字节跳动视频编解码面经
三四月份投了字节跳动的实习(图形图像岗位),然后hr打电话过来问了一下会不会opengl,c++,shador,当时只会一点c++,其他两个都不会,也就直接被拒了。 七月初内推了字节跳动的提前批,因为内推没有具体的岗位,hr又打电话问要不要考虑一下图形图像岗,我说实习投过这个岗位不合适,不会opengl和shador,然后hr就说秋招更看重基础。我当时想着能进去就不错了,管他哪个岗呢,就同意了面试...
Java学习的正确打开方式
在博主认为,对于入门级学习java的最佳学习方法莫过于视频+博客+书籍+总结,前三者博主将淋漓尽致地挥毫于这篇博客文章中,至于总结在于个人,实际上越到后面你会发现学习的最好方式就是阅读参考官方文档其次就是国内的书籍,博客次之,这又是一个层次了,这里暂时不提后面再谈。博主将为各位入门java保驾护航,各位只管冲鸭!!!上天是公平的,只要不辜负时间,时间自然不会辜负你。 何谓学习?博主所理解的学习,它是一个过程,是一个不断累积、不断沉淀、不断总结、善于传达自己的个人见解以及乐于分享的过程。
程序员必须掌握的核心算法有哪些?
由于我之前一直强调数据结构以及算法学习的重要性,所以就有一些读者经常问我,数据结构与算法应该要学习到哪个程度呢?,说实话,这个问题我不知道要怎么回答你,主要取决于你想学习到哪些程度,不过针对这个问题,我稍微总结一下我学过的算法知识点,以及我觉得值得学习的算法。这些算法与数据结构的学习大多数是零散的,并没有一本把他们全部覆盖的书籍。下面是我觉得值得学习的一些算法以及数据结构,当然,我也会整理一些看过...
大学四年自学走来,这些私藏的实用工具/学习网站我贡献出来了
大学四年,看课本是不可能一直看课本的了,对于学习,特别是自学,善于搜索网上的一些资源来辅助,还是非常有必要的,下面我就把这几年私藏的各种资源,网站贡献出来给你们。主要有:电子书搜索、实用工具、在线视频学习网站、非视频学习网站、软件下载、面试/求职必备网站。 注意:文中提到的所有资源,文末我都给你整理好了,你们只管拿去,如果觉得不错,转发、分享就是最大的支持了。 一、电子书搜索 对于大部分程序员...
linux系列之常用运维命令整理笔录
本博客记录工作中需要的linux运维命令,大学时候开始接触linux,会一些基本操作,可是都没有整理起来,加上是做开发,不做运维,有些命令忘记了,所以现在整理成博客,当然vi,文件操作等就不介绍了,慢慢积累一些其它拓展的命令,博客不定时更新 free -m 其中:m表示兆,也可以用g,注意都要小写 Men:表示物理内存统计 total:表示物理内存总数(total=used+free) use...
比特币原理详解
一、什么是比特币 比特币是一种电子货币,是一种基于密码学的货币,在2008年11月1日由中本聪发表比特币白皮书,文中提出了一种去中心化的电子记账系统,我们平时的电子现金是银行来记账,因为银行的背后是国家信用。去中心化电子记账系统是参与者共同记账。比特币可以防止主权危机、信用风险。其好处不多做赘述,这一层面介绍的文章很多,本文主要从更深层的技术原理角度进行介绍。 二、问题引入 假设现有4个人...
python学习方法总结(内附python全套学习资料)
不要再问我python好不好学了 我之前做过半年少儿编程老师,一个小学四年级的小孩子都能在我的教学下独立完成python游戏,植物大战僵尸简单版,如果要肯花时间,接下来的网络开发也不是问题,人工智能也可以学个调包也没啥问题。。。。。所以python真的是想学就一定能学会的!!!! --------------------华丽的分割线-------------------------------- ...
python 简易微信实现(注册登录+数据库存储+聊天+GUI+文件传输)
socket+tkinter详解+简易微信实现 历经多天的努力,查阅了许多大佬的博客后终于实现了一个简易的微信O(∩_∩)O~~ 简易数据库的实现 使用pands+CSV实现数据库框架搭建 import socket import threading from pandas import * import pymysql import csv # 创建DataFrame对象 # 存储用户数据的表(...
程序员接私活怎样防止做完了不给钱?
首先跟大家说明一点,我们做 IT 类的外包开发,是非标品开发,所以很有可能在开发过程中会有这样那样的需求修改,而这种需求修改很容易造成扯皮,进而影响到费用支付,甚至出现做完了项目收不到钱的情况。 那么,怎么保证自己的薪酬安全呢? 我们在开工前,一定要做好一些证据方面的准备(也就是“讨薪”的理论依据),这其中最重要的就是需求文档和验收标准。一定要让需求方提供这两个文档资料作为开发的基础。之后开发...
网页实现一个简单的音乐播放器(大佬别看。(⊙﹏⊙))
今天闲着无事,就想写点东西。然后听了下歌,就打算写个播放器。 于是乎用h5 audio的加上js简单的播放器完工了。 演示地点演示 html代码如下` music 这个年纪 七月的风 音乐 ` 然后就是css`*{ margin: 0; padding: 0; text-decoration: none; list-...
Python十大装B语法
Python 是一种代表简单思想的语言,其语法相对简单,很容易上手。不过,如果就此小视 Python 语法的精妙和深邃,那就大错特错了。本文精心筛选了最能展现 Python 语法之精妙的十个知识点,并附上详细的实例代码。如能在实战中融会贯通、灵活使用,必将使代码更为精炼、高效,同时也会极大提升代码B格,使之看上去更老练,读起来更优雅。
数据库优化 - SQL优化
以实际SQL入手,带你一步一步走上SQL优化之路!
2019年11月中国大陆编程语言排行榜
2019年11月2日,我统计了某招聘网站,获得有效程序员招聘数据9万条。针对招聘信息,提取编程语言关键字,并统计如下: 编程语言比例 rank pl_ percentage 1 java 33.62% 2 cpp 16.42% 3 c_sharp 12.82% 4 javascript 12.31% 5 python 7.93% 6 go 7.25% 7 p...
通俗易懂地给女朋友讲:线程池的内部原理
餐盘在灯光的照耀下格外晶莹洁白,女朋友拿起红酒杯轻轻地抿了一小口,对我说:“经常听你说线程池,到底线程池到底是个什么原理?”
《奇巧淫技》系列-python!!每天早上八点自动发送天气预报邮件到QQ邮箱
将代码部署服务器,每日早上定时获取到天气数据,并发送到邮箱。 也可以说是一个小型人工智障。 知识可以运用在不同地方,不一定非是天气预报。
经典算法(5)杨辉三角
杨辉三角 是经典算法,这篇博客对它的算法思想进行了讲解,并有完整的代码实现。
Python实例大全(基于Python3.7.4)
博客说明: 这是自己写的有关python语言的一篇综合博客。 只作为知识广度和编程技巧学习,不过于追究学习深度,点到即止、会用即可。 主要是基础语句,如三大控制语句(顺序、分支、循环),随机数的生成,数据类型的区分和使用; 也会涉及常用的算法和数据结构,以及面试题相关经验; 主体部分是针对python的数据挖掘和数据分析,主要先攻爬虫方向:正则表达式匹配,常用数据清洗办法,scrapy及其他爬虫框架,数据存储方式及其实现; 最后还会粗略涉及人工智能领域,玩转大数据与云计算、进行相关的预测和分析。
腾讯算法面试题:64匹马8个跑道需要多少轮才能选出最快的四匹?
昨天,有网友私信我,说去阿里面试,彻底的被打击到了。问了为什么网上大量使用ThreadLocal的源码都会加上private static?他被难住了,因为他从来都没有考虑过这个问题。无独有偶,今天笔者又发现有网友吐槽了一道腾讯的面试题,我们一起来看看。 腾讯算法面试题:64匹马8个跑道需要多少轮才能选出最快的四匹? 在互联网职场论坛,一名程序员发帖求助到。二面腾讯,其中一个算法题:64匹...
面试官:你连RESTful都不知道我怎么敢要你?
干货,2019 RESTful最贱实践
刷了几千道算法题,这些我私藏的刷题网站都在这里了!
遥想当年,机缘巧合入了 ACM 的坑,周边巨擘林立,从此过上了"天天被虐似死狗"的生活… 然而我是谁,我可是死狗中的战斗鸡,智力不够那刷题来凑,开始了夜以继日哼哧哼哧刷题的日子,从此"读题与提交齐飞, AC 与 WA 一色 ",我惊喜的发现被题虐既刺激又有快感,那一刻我泪流满面。这么好的事儿作为一个正直的人绝不能自己独享,经过激烈的颅内斗争,我决定把我私藏的十几个 T 的,阿不,十几个刷题网...
为啥国人偏爱Mybatis,而老外喜欢Hibernate/JPA呢?
关于SQL和ORM的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行了一番讨论,感触还是有一些,于是就有了今天这篇文。 声明:本文不会下关于Mybatis和JPA两个持久层框架哪个更好这样的结论。只是摆事实,讲道理,所以,请各位看官勿喷。 一、事件起因 关于Mybatis和JPA孰优孰劣的问题,争论已经很多年了。一直也没有结论,毕竟每个人的喜好和习惯是大不相同的。我也看...
SQL-小白最佳入门sql查询一
不要偷偷的查询我的个人资料,即使你再喜欢我,也不要这样,真的不好;
JavaScript 为什么能活到现在?
作者 | 司徒正美 责编 |郭芮 出品 | CSDN(ID:CSDNnews) JavaScript能发展到现在的程度已经经历不少的坎坷,早产带来的某些缺陷是永久性的,因此浏览器才有禁用JavaScript的选项。甚至在jQuery时代有人问出这样的问题,jQuery与JavaScript哪个快?在Babel.js出来之前,发明一门全新的语言代码代替JavaScript...
项目中的if else太多了,该怎么重构?
介绍 最近跟着公司的大佬开发了一款IM系统,类似QQ和微信哈,就是聊天软件。我们有一部分业务逻辑是这样的 if (msgType = "文本") { // dosomething } else if(msgType = "图片") { // doshomething } else if(msgType = "视频") { // doshomething } else { // doshom...
Nginx 原理和架构
Nginx 是一个免费的,开源的,高性能的 HTTP 服务器和反向代理,以及 IMAP / POP3 代理服务器。Nginx 以其高性能,稳定性,丰富的功能,简单的配置和低资源消耗而闻名。 Nginx 的整体架构 Nginx 里有一个 master 进程和多个 worker 进程。master 进程并不处理网络请求,主要负责调度工作进程:加载配置、启动工作进程及非停升级。worker 进程负责处...
致 Python 初学者
欢迎来到“Python进阶”专栏!来到这里的每一位同学,应该大致上学习了很多 Python 的基础知识,正在努力成长的过程中。在此期间,一定遇到了很多的困惑,对未来的学习方向感到迷茫。我非常理解你们所面临的处境。我从2007年开始接触 python 这门编程语言,从2009年开始单一使用 python 应对所有的开发工作,直至今天。回顾自己的学习过程,也曾经遇到过无数的困难,也曾经迷茫过、困惑过。开办这个专栏,正是为了帮助像我当年一样困惑的 Python 初学者走出困境、快速成长。希望我的经验能真正帮到你
Python 编程开发 实用经验和技巧
Python是一门很灵活的语言,也有很多实用的方法,有时候实现一个功能可以用多种方法实现,我这里总结了一些常用的方法和技巧,包括小数保留指定位小数、判断变量的数据类型、类方法@classmethod、制表符中文对齐、遍历字典、datetime.timedelta的使用等,会持续更新......
吐血推荐珍藏的Visual Studio Code插件
作为一名Java工程师,由于工作需要,最近一个月一直在写NodeJS,这种经历可以说是一部辛酸史了。好在有神器Visual Studio Code陪伴,让我的这段经历没有更加困难。眼看这段经历要告一段落了,今天就来给大家分享一下我常用的一些VSC的插件。 VSC的插件安装方法很简单,只需要点击左侧最下方的插件栏选项,然后就可以搜索你想要的插件了。 下面我们进入正题 Material Theme ...
“狗屁不通文章生成器”登顶GitHub热榜,分分钟写出万字形式主义大作
一、垃圾文字生成器介绍 最近在浏览GitHub的时候,发现了这样一个骨骼清奇的雷人项目,而且热度还特别高。 项目中文名:狗屁不通文章生成器 项目英文名:BullshitGenerator 根据作者的介绍,他是偶尔需要一些中文文字用于GUI开发时测试文本渲染,因此开发了这个废话生成器。但由于生成的废话实在是太过富于哲理,所以最近已经被小伙伴们给玩坏了。 他的文风可能是这样的: 你发现,...
相关热词 c#中dns类 c#合并的excel c# implicit c#怎么保留3个小数点 c# 串口通信、 网络调试助手c# c# 泛型比较大小 c#解压分卷问题 c#启动居中 c# 逻辑或运算符
立即提问