html2pdf导出，windows下正常，linux下乱吗

本来直接用的jsoup，换了linux后乱码了，最后发现linux下读取个文件都乱码
linux下网页内容字节流保存本地xml文件正常没有乱码，然后读取文件就乱码了，
各位大神这啥原因啊，代码里编码都对应的，windows下都正常的，换linux就乱码了

public String convert2PDF() {
PdfContentByte content = null;
BaseFont base = null;
Rectangle pageRect = null;
String pdfPath = context
.getRealPath("/pdfIn/"
+ (new SimpleDateFormat("yyyyMMddHHmmssSSS")
.format(new Date()) + ".pdf"));
String outPath = context
.getRealPath("/pdfOut/"
+ (new SimpleDateFormat("yyyyMMddHHmmssSSS")
.format(new Date()) + ".pdf"));

    String fontPath = context.getRealPath("/font/msyh.ttf");
    String contextPath = context.getContextPath();
    //
    FileOutputStream fos;
    InputStream is;
    try {
        jsp = jsp == null ? "" : jsp;
        //
        URL url = new URL(jsp);
        byte bytes[] = new byte[1024 * 1000];

        String tmpXml = context.getRealPath("/tmpXml/"
                + (new SimpleDateFormat("yyyyMMddHHmmssSSS")
                        .format(new Date()) + ".html"));
        File xml = new File(tmpXml);
        if (!xml.getParentFile().exists())
            xml.getParentFile().mkdirs();
        if (!xml.exists())
            xml.createNewFile();

        int index = 0;
        is = url.openStream();
        int count = is.read(bytes, index, 1024 * 100);
        while (count != -1) {
            index += count;
            count = is.read(bytes, index, 1);
        }
        fos = new FileOutputStream(xml);
        System.out.println(index);
        fos.write(bytes, 0, index);
        // is.close();
        fos.close();
        FileInputStream fis = new FileInputStream(xml);
        InputStreamReader isr = new InputStreamReader(fis, "utf-8");
        BufferedReader br = new BufferedReader(isr);
        StringBuffer sb = new StringBuffer();
        String line = "";
        while ((line = br.readLine()) != null) {
            sb.append(line);
        }
        br.close();
        System.err.println(sb.toString());
        //TODO 读取本地文件乱码问题 
        org.jsoup.nodes.Document doc1 = Jsoup.parse(sb.toString());
        // org.jsoup.nodes.Document doc2 = Jsoup.parse(xml, "GBK");
        System.out.println(doc1.toString());
        // System.out.println(doc2.toString());
        File tmp = new File(pdfPath);
        if (!tmp.getParentFile().exists())
            tmp.getParentFile().mkdirs();
        // System.out.println("-- created -in===" + tmp.getPath());
        Document document = new Document();
        PdfWriter writer = PdfWriter.getInstance(document,
                new FileOutputStream(tmp));
        document.open();
        // Connection conn = Jsoup.connect(jsp);
        // conn.header(
        // "User-Agent",
        // "Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/40.0.2214.111 Safari/537.36");
        // org.jsoup.nodes.Document doc = conn.timeout(5000).get();
        // doc1.select("div#getpdf").remove();
        InputStream in = new ByteArrayInputStream(doc1.toString().getBytes(
                "utf-8"));
        // System.out
        // .println("-- FileInputStreamFileInputStreamFileInputStreamFileInputStreamFileInputStreamFileInputStreamFileInputStreamFileInputStream");
        XMLWorkerHelper.getInstance().parseXHtml(writer, document, in,
                Charset.forName("utf-8"));
        // System.out
        // .println("-- FileInputStreamFileInputStreamFileInputStreamFileInputStreamFileInputStreamFileInputStreamFileInputStreamFileInputStream");
        document.close();
        File out = new File(outPath);
        if (!out.getParentFile().exists())
            out.getParentFile().mkdirs();
        if (!out.exists())
            out.createNewFile();
        System.out.println("-- created -out===" + out.getPath());
        PdfReader pdfReader = new PdfReader(tmp.getPath());
        PdfStamper pdfStamper = new PdfStamper(pdfReader,
                new FileOutputStream(out));
        //
        PdfGState gs = new PdfGState();
        base = BaseFont.createFont("STSong-Light",   "UniGB-UCS2-H",   BaseFont.NOT_EMBEDDED);

// base = BaseFont.createFont(fontPath, BaseFont.IDENTITY_H,
// BaseFont.NOT_EMBEDDED);
System.out.println("-- -fontPath===" + fontPath);
if (base == null || pdfStamper == null) {
msg = "文件生成失败！";
ActionContext.getContext().put("msg", msg);
path = "error";
}
// 设置透明度为0.4
gs.setFillOpacity(0.4f);
gs.setStrokeOpacity(0.4f);
int toPage = pdfStamper.getReader().getNumberOfPages();
for (int i = 1; i <= toPage; i++) {
pageRect = pdfStamper.getReader().getPageSizeWithRotation(i);
// 计算水印X,Y坐标
float x = pageRect.getWidth() / 2;
float y = pageRect.getHeight() / 2;
// 获得PDF最顶层
content = pdfStamper.getOverContent(i);
content.saveState();
// set Transparency
content.setGState(gs);
content.beginText();
content.setColorFill(BaseColor.GRAY);
content.setFontAndSize(base, 60);
// 水印文字成45度角倾斜
content.showTextAligned(Element.ALIGN_CENTER, "eeeee", x, y, 45);
content.endText();
}
//
pdfStamper.close();
// tmp.delete();
// path = jsp.split(contextPath)[0] + contextPath+"/"+
// out.getPath().replace("\",
// "/").split(contextPath)[1].split("/")[1]+"/"+out.getPath().replace("\",
// "/").split(contextPath)[1].split("/")[2];
path = out.getPath().replace("\", "/").split("pdfOut")[0]
+ "pdfOut/$"
+ out.getPath().replace("\", "/").split("pdfOut")[1]
.split("/")[1];
System.out.println("-- created -pdf path===" + path);
} catch (Exception ex) {
ex.printStackTrace();
msg = "文件生成异常！";
ActionContext.getContext().put("msg", msg);
path = "error";
} finally {
content = null;
base = null;
pageRect = null;
}
return SUCCESS;

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
一枪尽骚丶魂 2016-03-29 12:11
关注
在linux下和win下面的文件格式不一样的，你读写文件的方式可能有问题

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

window 导出正常，linux导出有问题 java linux
2023-02-15 13:51

回答 4 已采纳根据您提供的代码，似乎问题出在文件路径的拼接上。在 Windows 上，文件路径使用的是反斜杠 ""，而在 Linux 上，文件路径使用的是正斜杠 "/"。因此，如果您的代码在 Windows 上可以
myeclipse ssh框架下怎么使用pdf导出后端有问必答
2022-04-18 16:13

回答 2 已采纳导出excel、word和pdf文件，详细步骤参考：https://blog.csdn.net/jq1223/article/details/115366079
Java 代码编写linux系统下，达梦数据库导出sql文件，不使用迁移工具，怎么导出 java linux sql
2021-09-26 10:08

回答 1 已采纳直接服务器操作的话，可以直接mysqldump
NetCore实战：基于html生成pdf文件案例讲解
2022-11-14 22:40

IT技术分享社区的博客并且支持在Windows、Docker、Linux、MacOSX运行。主要功能实现在线URL转pdf文件或者html代码直接转换为pdf文件，并对css样式、图片等很好的支持，导出的pdf文件和网站相差不大。工具→NuGet包管理器→管理解决方案的...
bootstrap-table-export 导出图片时html2canvas无法截全部 bootstrap jquery 前端框架有问必答
2022-05-08 10:46

回答 2 已采纳配置了高度，超出屏幕外的内容无法导出，可以设置全部显示内容后，执行导出再还原回原来的高度，电脑配置不行可以会出现闪动问题。示例可以参考下面的 TableExport
将html和google图表导出为pdf而不会丢失样式css html javascript jquery php
2019-06-10 18:02

回答 1 已采纳 good guys the solution menojr that I found the challenge was this even if I do not achieve with th
为什么我的 markdownpad2 导出的pdf 内容是空的？ java
2019-12-22 17:24

回答 1 已采纳我一般用 Typora https://jingyan.baidu.com/article/03b2f78c2b03005ea237ae3a.html
html转pdf（总结五种方法Java）
2022-12-01 21:45

泰山码的博客 html转pdf
vue+elementui的项目表格怎么导出为pdf文件呀 elementui javascript vue.js
2021-07-19 14:20

回答 2 已采纳让后端处理，他还给你一个url，你直接window.location.href = url就直接打开下载就好了，给个采纳吧
html如何将输入文本框的内容进行导出 html5 有问必答
2021-07-22 13:14

回答 5 已采纳你自己耍来玩可以保存到localStorage中，但是不能和其他用户和浏览器共享数据，要共享数据需要搭建web服务器保存到数据库中导出可以通过blob导出，示例代码如下，有帮助麻烦点个采纳【本回答右
java编写Linux系统下，不使用迁移工具，达梦数据库导出文件为.sql形式，而不是dmp，怎么实现导出 java linux 数据库
2021-09-26 17:44

回答 1 已采纳数据库应该也有这种功能，写个shell脚本导出就行了，你用代码执行这个shell文件即可实在顶不住，自己去查db，构造sql语句写入到sql文件就行了
win10 win11 wsl2 从0打造linux开发环境构建(持续更新)
2022-04-24 10:23

交叉编译之王 hahaha的博客 1.操作系统 windows+bash 全世界都知道win10是linux最好的发行版 ! 一种新型的嵌入式开发系统平台构建方式，从16年开始，windows10...借助最新的WSL服务，可以在一个窗口下，同时启动windows软件，和linux系统内的
linux executable函数导出问题 c++ linux
2016-03-31 08:32

回答 2 已采纳我已经解决了。可以关闭了。很简单只是自己不知道而已。就是一个编译选项问题而已。谢谢你了。
Windows虚拟机系列：win10 win11 wsl2 从0打造linux开发环境构建(持续更新)
2024-01-12 20:09

坦笑&&life的博客 win10 win11 wsl2 从0打造linux开发环境构建(持续更新)
java使用itext7实现html转pdf
2022-08-31 16:14

_陌子曦的博客使用itext7html转pdf
没有解决我的问题, 去提问

悬赏问题

¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记
¥15 保护模式-系统加载-段寄存器

html2pdf导出，windows下正常，linux下乱吗

2条回答 默认 最新

悬赏问题

2条回答默认最新