XMLWorkHelper将html转换成pdf的时候,有分页,错行怎么处理?求各位大神解决下,着急

包如下:
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;

import com.itextpdf.text.Document;
import com.itextpdf.text.pdf.PdfWriter;
import com.itextpdf.tool.xml.XMLWorkerHelper;

代码如下:
Document document = new Document();
// step 2
PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream("C:/Users/longlong/Desktop/demo.pdf"));

        // step 3
        document.open();

// InputStreamReader isr = new InputStreamReader(new FileInputStream("C:/Users/longlong/Desktop/customer.html"), "UTF-8");
InputStream in = new FileInputStream(new File("C:/Users/longlong/Desktop/customer.html"));
// step 4
// XMLWorkerHelper.getInstance().parseXHtml(writer, document,isr);
XMLWorkerHelper.getInstance().parseXHtml(writer, document, in, null, new MyFont());
//step 5
document.close();

        System.out.println( "PDF Created!" );
xml
0

2个回答

html是很难解析的。有错行不能完全怪程序。

html的原始数据流和排版出来的往往不同。比如说,一排导航,其实是通过li ui元素实现的,在没有css的情况下,它们垂直排列。
另外div布局可以把本来前后关系的文章段落并排显示成两列。
而一些作为占位符而没有实际内容的元素,在没有css的情况下也表现为多余的空行。

即便是word这样的商业软件,处理起来也显得笨拙,经常转换出来差强人意。

关键看你的html怎么写的,你应该优先考虑迁就html的设计。

0

那请问html要怎么设计,转成的pdf才可以正常显示?柑橘你说的有点笼统,我用XMLWork把html转成pdf的时候内容是正常的,错行的问题是怎么产生的?是因为java解析的html的原因还是html本身标签的问题?

0
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
html转换pdf 页面抓取内容,分页进行处理,后台进行处理,功能效果不错
html转换pdf 页面抓取内容,分页进行处理,后台进行处理,功能效果不错
通过PD4ML把html转pdf(包含显示页眉页脚,插入图片,显示页数)
package nachuan;import java.awt.Insets;import java.io.ByteArrayOutputStream;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.IOException;import java.io.StringReader;...
wkhtmltopdf分页带来的问题
wkhtmltopdf生成的pdf分页的时候有下面这个问题:nnnn然后经过搜索,加上page-break-inside:avoid;样式解决了。但是带来了新的问题,nn原来的截断文字状况没了,但是导致文字挤压重叠了,需要加上nnpage-break-before: always; page-break-after: always;这两个属性。n...
Html导出PDF,根据页面中空白间隙动态分页(A4纸)
n//首先,下载扩展后的jspdf: http://workshop.red/lib/jspdf.debug.jsnnnnvar targetDom = $('#qyjxpjzdContent'); //获取要导出的domnn/*如果你的页面中有svg,请开启以下功能n 因为html2canvas 不能完全识别svg或者不识别svg中部分元素的属性,如:entirety.html页面中的filt...
jspdf把html转化成pdf,支持分页,图片文字混排
 nn需要批量把工厂订单打印,还要有产品图片,描述nnHTML一定要切记要打印的父元素,加上宽度,间距否则pdf会显示的不正确,宽度写在style上(在css上不起作用)nnimg也是如此!!!!!nnn<img src="/images/test.jpeg" style="display:inline-block;max-width: 300px;max-height:400px;"&gt...
C# WPF 扫雷
有个不好的地方,就是开始的时候会卡住,求大神告知怎么优化。
Openoffice转换多列EXCEL为PDF行列对应解决方法
当转换多列EXCEL为PDF时,如EXCEL列过多,则会换行显示,上述java将EXCEL缩小转换,类百度文库做法。EXCEL经上述处理后在进行转换就可以转换成为一行对应一行的pdf
phantomjs 将html 转换为图片或者pdf
通常我们有需求将前端展示的报表下载为图片或者pdf,那么就需要将html 转为png/jpeg 或者pdf。rn下面讲解phantomjs 如何将html转图片和pdf.rn到官网下载对应的版本 :下载链接rn我下载的是window版 phantomjs2.1.1 rn将安装目录下的bin目录添加到环境变量,这个在全局都可以使用phantomjs 命令rnphantomjs 相关文档请查看官网ap
Java中使用phantomjs将HTML页面转为pdf
之前有个需求,将页面转为pdf,当时使用itext转换,但是呢样式与实际在浏览器中打开的样式存在差异。比如选择项长得不一样,CheckBox长得不一样,这就不行,需求要跟浏览器打开一模一样,后经过多方面查找,终于找到一个靠谱点的解决方案:使用phantomjs插件。nn首先下载 phantomjs 插件:nnhttps://download.csdn.net/download/qq_2113455...
使用jspdf和htm2canvas将html数据生成pdf分页时遇到的问题
n内容过多时分页成了这样,如何能够让分页时不会把文字隔开,按照空白处分页呢?求解nn
使用itext根据freemarks模版生成pdf,表格产生跨页问题解决方法
java根据模版动态生成pdf的文章点击打开链接rn  使用XMLWorkerHelper.getInstance().parseXHtml();生成pdf。rnrn如果直接根据ftl模版中的填充数据,如果表格列大于第一列填充空白,整个表格会整体移到第二页。rn整个表格列大于整页pdf空白,会直接不显示表格。主要看我循环的模版代码,就可以完全解决这个问题。rn我的list中循环的是div+表格nn
Java将HTML转化为PDF+获得页数+合并PDF
n n n 最近公司用到了HTML转PDF的技术,这里就把用到的方式和技术在这...
使用phantomjs将网页转换成pdf或者长图片
最近有一个将微信公众号的文章转为pdf的想法,主要是为了将很多文章保存下来,方便打印阅读。nn最终使用的方法是phantomjs来生成网页的pdf。nnPhantomJS 是一个基于WebKit的服务器端 JavaScript API。它全面支持web而不需浏览器支持,其快速,原生支持各种Web标准: DOM 处理, CSS 选择器, JSON, Canvas, 和 SVG。PhantomJS可以...
将html转换成pdf
将html转换成pdf,传递url,生成pdf,适合简单的pdf制作,不支持分页
itext实现html转换成pdf (将带分页execl的html转换成pdf)
 1.首先下载itext2.08,iTextAsian(亚洲国际化包支持pdf中显示中文),core-Renderer(解析xhtml转换成pdf支持包),jtidy(html转换成xhtml支持包).其中core-Renderer包必须配合itext2.08版本的包,否则会抛出没有是public int[] getCharBBox(char c) 方法异常。rn rn2.使用HttpURLCon...
JS 如何将 HTML 页面导出为多页 PDF
前话之前写了一篇博文 JS 如何将 HTML 页面导出为 PDF 。 n当时只是自己有个需求,只是导出一页PDF,写个了示例。之后就有同学私信我问我怎么导出多页PDF。好吧,其实这些看文档画画图自己是可以写出来的。以后也可能有转换HTML导出多页的PDF需求,就决定写一个库 renderPDF 吧。地址在这里:https://github.com/pwcong/how-transform-html-
Html后台转PDF
工具:yahp, org.allcolor.yahp.converter.CYaHPConverterrn网址:http://www.allcolor.org/YaHPConverter/rn做法: 前台将html块提交到后台,后台调用相关类转成PDFrn注意: 为了防止css样式丢失,html块中指定样式,但是样式从后台获取:rnrn提交下面的div到后台rn[code="html"]rn rn...
如何在Java中将XML文档转换成HTML文档.pdf
如何在Java中将XML文档转换成HTML文档.pdf
html转pdf(亲测可用)
html转pdf。兼容IE,包含jar包(jspdf.debug.js html2canvas.js bluebird.js)
关于通过iText通过HTML转成PDF导出的操作遇到一些问题的记录
最近做项目,iText通过html转化为pdf导出的一些总结,大家可以看看,如果有什么问题欢迎指正。
JS实现HTML转pdf(支持高清放大及分页)详解
在这里我主要讲述实现思路及方法,原理大家可以自行百度,写此文章主要是网上的很多实现方案都不能很好的支持高清放大及分页。首先:引入三个js插件,请自行上网百度下载,注意html2canvas.js版本太高会出现Promise未定义,本人猜测ES6高版本中可能用到ES6语法,请注意。                jspdf.min.js                            htm...
教你怎么将pdf转换成html格式
怎么把PDF格式的文件转换成html格式的呢?平时为了方便阅读可能会将文件内容做成PDF格式的档案给大家浏览,但是有时候由于某些原因需求也会将PDF文件内容改成网页形式的让大家来浏览,怎么做呢?怎么将PDF格式的文件转换成html格式方便大家浏览呢?小编这里为大家推荐一款实用的工具——迅捷pdf转换成html转换器,它能方便进行文件格式相互转换。rnrn   软件的操作步骤非常的方便快捷,主要分成
Python快速将HTML转PDF,妈妈再也不会担心我不会转PDF了
本文同步发表于我的微信公众号,扫一扫文章底部的二维码或在微信搜索 极客导航 即可关注。nn概况n在日常工作生活中,有时候需求是将HTML转成PDF,网上一些工具也有很多,不过一般都是在线转换或者一次只能转一张,甚至一些工具需要充值…nn今天我们python写一个HTML转成PDF程序,对于一些会Python的小伙伴来说,自己写的程序,自由度比较高。n准备工作n我们今天用到的库是:pdfkitn安...
flyingSaucer.jar
flyingSaucer 将HTML转换成PDF,并解决中文乱码问题
freemarker生成html、html转pdf、pdf根据关键字定位、pdf签名
freemarker生成html、html转pdf、pdf根据关键字定位、pdf签名图片PdfUtil 类 (全部功能代码)Content 类 (自己创建相关文件)相关依赖(基于spring-boot测试)nPdfUtil 类 (全部功能代码)npackage com.wei.weitest.pdf;nnimport java.io.BufferedWriter;nimport java.i...
Itext将HTML文件转换成PDF
rnItext将HTML文件转换成PDFrn1.需要下载 itext.jar包,xmlworker-5.5.4.zip,这些包都能在sourceforge中找到!rn效果图:rnrnpackage com.pdfbox.pdf;rnrnimport java.io.FileOutputStream;rnimport java.io.InputStream;rnimport java.io.Outp...
java pdf转svg jpdf相关jar包及实例(转html自行查找svg嵌入html页面方法)
完整java pdf转svg jpdf相关jar包及实例(转html自行查找svg嵌入html页面方法)。具体方法请参照jpdfweb官方网站
C#中HTML转PDF Pechkin
这个版本解决了在web项目使用时生成一次pdf后就锁住的问题
使用XMLWorkerHelper.getInstance().parseXHtml生成PDF时中文不显示或乱码问题
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:nMarkdown和扩展Markdown简洁的语法n代码块高亮n图片链接和图片上传nLaTex数学公式nUML序列图和流程图n离线写博客n导入导出Markdown文件n丰富的快捷键n快捷键n加粗 Ctrl + B n斜体 Ctrl + I n引用 Ctrl
freemark方式讲HTML模版转换成PDF
n/**n * freemarker渲染htmln */npublic static String freeMarkerRender(Map<String, Object> data, String htmlTmp, String path) {nn Writer out = new StringWriter();n try {n freemarkerCfg....
分页出现数据重复的解决方案
用户量急剧上升中,偶尔会发现这么一个问题,就是下一页的数据中总会出现上一页的几条数据。 为什么会造成这个问题呢?用户在查询第一页的时候,停留了一下,然后在这段时间内 又有两个用户注册了,然后请求第二页的数据的时候 排序的时候 两个新用户排在了最前面(按照注册时间排序) 所以第二次排序的时候就变成了第二页的数据。nn那如何解决这个问题呢?nn在每次请求的时候都带上前台最后一条数据的注册时间,然后查...
html 转换成pdf
[size=medium][b][color=blue]解决需求:[/color][/b][/size]rnrn[b]1.字符串html代码转换成pdf文件[/b]rn[b]2.根据FreeMarker模板动态生成静态html文件[/b]rn[b]3.把静态html文件装换成pdf文件rn4.解决html编写不够严谨规范的问题,自动转换为符合规范的格式rn5.支持中文及换行rn6.pdf文件打水印...
关于pdf转html的个人方法
曾经看到这样一篇文章,说的是工作中到需要将pdf导成html,然后前端程序猿开始运经过一系列的复杂操作完成了这项工作。当时很觉得这应该算极少数的需求,直到我们的程序猿找到了我...rn pdf转html现在已经有专门的工具可以实现了,远没有那么麻烦,其实我第一次在pdf转换器里看到这个功能的时候,很不理解,什么样的情况下需要将pdf导成html?当然,现在依然不理解,但确实有这样的需求在,也有这样
基于Spire.PDF将HTML转换为PDF
将HTML转换为PDF几乎与每个人或群体相关,因为PDF是安全分发或共享的最佳格式。那么我们应该如何轻松地将html转换为PDF并且安全地变得非常重要。在线HTML到PDF转换器真的很方便,但可能会导致隐私泄露,这可能是致命的,特别是对于合作,公司和组织。一个合理的解决方案是我们可以自己定制html到PDF。nn通过使用专业的PDF组件 Spire.PDF,您可以在.NET,WPF和Silverl...
Java使用 itext7 导出pdf ,表格跨页分行问题
问题描述:nn         项目中使用的是7版本的itext,创建document后,往文档中插入表示使用对象:com.itextpdf.layout.element.Table。导出来的pdf,表格行数据,在跨页时出现同行数据分页显示,如下:nnnnnn nn解决方式:创建表格每个单元格是设置setKeepTogether属性为truenn...
前端和java后台将HTML转换成pdf
java后台HTML转换成pdfnprivate final static String DEST = "C:\\80afa41a3bfc474cbf1ac8b5bc1d.pdf"; //生成pdf的路径n private final static String SRC = "D:\\3b33a68bbf52417aac48687937352464.html"; //html文件路径n publi...
如何将CAD图纸转换成为PDF文件
在发送CAD图纸给他人查看的时候,如果对方没有安装相应的查看工具就无法打开文件查看图纸内容。那么最好的方法就是将CAD图纸转为PDF文件,这样可以方便在任何设备上进行查看。rnrnrnrn  一些较小,未超过2M大小的CAD文件,可以直接在线转换成为pdf。首先要进入在线cad转pdf页面,在“文档转换”中选择“cad转pdf”。rnrnrnrnrnrnrnrnrnrnrn  进入操作页面后,点击
html2pdf(html转换pdf)
html2pdf(html转换pdf), html2canvas+jspdf+pdfmake+jquery 页面直接html生成pdf文件,避免了,过多人下载pdf,消耗服务器资源的一个解决方案。如果并发量大的情况下,很好的解决了服务器的压力。 自己研究了好长时间终于搞定了
html文件转换成pdf三种实现方式支持批量转换
最近接触把html文件转换成pdfnn三种实现方法nn(1).用wkhtmlhopdf工具 nn(2).js前台去完成转换nn(3).itext的方式nn第一种方式比较完美 图片文字支持的比较好 ,而且也可以批量去生成,生成的pdf文字是可以copy的nn第二种js的方式其实就是吧当前页面截图然后放到pdf文件中,只是个图片文字无法选中.nn第三种itext的方式对文字支持的不太好,而且对cs...
java操作html转换成pdf文件的实例代码
java操作html转换成pdf文件的实例代码:rnpackage test;nimport java.io.File;nimport java.io.FileOutputStream;nimport java.io.OutputStream;nimport org.xhtmlrenderer.pdf.ITextFontResolver;nimport org.xhtmlrenderer.pdf.
文章热词 机器学习教程 Objective-C培训 交互设计视频教程 颜色模型 设计制作学习
相关热词 mysql关联查询两次本表 native底部 react extjs glyph 图标 java大神班 大数据大神班