poi读取word部分乱码

使用poi读取word文档并保存到数据库，在开发模式下没有任何问题，部署到linux服务器也没有问题，但是部署到windows系统上时，会有部分乱码现象。如下图

代码如下


   public ResultUtils<String> importWord(@RequestParam(value = "file", required = true) MultipartFile file) throws IOException, ParseException {
        String textFileName=file.getOriginalFilename();
//        Resource resource = new ClassPathResource(textFileName);
//        InputStream inputStream = resource.getInputStream();
       String fileName = file.getOriginalFilename();

       InputStream inputStream = file.getInputStream();

        String suff = fileName.substring(fileName.lastIndexOf(".") + 1);
        String content = "";
        if ("docx".equals(suff)) {
            XWPFDocument xdoc = new XWPFDocument(inputStream);
            XWPFWordExtractor extractor = new XWPFWordExtractor(xdoc);
            content = extractor.getText();
            System.out.println(content);
            employeeService.insertNewEmployee(content);

            extractor.close();
        } else if ("doc".equals(suff)) {
            WordExtractor ex = new WordExtractor(inputStream);
            content = ex.getText();

            int insertResult = employeeService.insertNewEmployee(content);
            if(insertResult==7){
                return ResultUtils.fail("添加家属信息失败，请联系管理员");
            }
            if (insertResult==6){
                return ResultUtils.fail("添加简历失败，请联系管理员");
            }
            if (insertResult==5){
                return ResultUtils.fail("该员工已加入，请勿重复添加！");
            }
            if (insertResult==0){
                return ResultUtils.fail("添加员工失败，请联系管理员");
            }
            ex.close();
        } else {
            System.out.println("此文件不是word文件");
        }
        return ResultUtils.success("添加成功！");
    }

insertNewEmployee的方法是存入数据库的，这个怎么解决，有知道的吗

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-09-21 23:06
关注
【以下回答由 GPT 生成】

我可以尝试帮助你解决这个乱码问题。乱码问题通常是由于不同的字符编码引起的。在这种情况下，你可以尝试以下解决方案:

确保你的数据库表的字符集编码是正确的，并且与你读取的文本内容的字符集编码一致。你可以通过执行以下SQL查询语句来检查和修改数据库表的字符集编码:

SHOW CREATE TABLE your_table_name; ALTER TABLE your_table_name CONVERT TO CHARACTER SET utf8; -- 替换 utf8 为正确的字符集编码

确保你通过String对象保存文本内容时，使用了正确的字符集编码。你可以在保存文本内容之前，将其转换为正确的字符集编码，例如UTF-8:

byte[] bytes = content.getBytes("ISO-8859-1"); // 将文本内容从 ISO-8859-1 转换为字节数组 content = new String(bytes, "UTF-8"); // 将字节数组转换为 UTF-8 编码的字符串

确保你读取文件时使用了正确的字符集编码。你可以尝试在读取文件之前，指定字符集编码为UTF-8:

InputStream inputStream = file.getInputStream(); BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream, "UTF-8")); // 接下来使用 reader 来读取文本内容

如果以上方法仍然不能解决乱码问题，你可能需要检查你读取的Word文档本身的字符集编码。你可以尝试打开Word文档，然后使用"另存为"功能，将其另存为UTF-8编码的文档，并使用新生成的UTF-8文档进行读取。

如果以上方法都不能解决问题，可能还需要进一步调查你的环境和具体的错误日志，以便确定准确的解决方法。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

poi 跨列合并word中的表格的单元格
2018-03-13 01:50

回答 2 已采纳最后研究发现，该行代码在word2010有用，在wps中无效
利用poi向word中填充数据 java
2020-07-31 12:35

回答 3 已采纳可以直接在word中用一个特殊的字符表示（所谓特殊，就是避免和实际的正文一样导致混淆）。比如说叫做" {{companyname}}"或者 "%%address" 这个你可以自己发挥这样，你
用poi将word07转html 一直报错 html5
2017-07-04 00:53

回答 1 已采纳现在又出现新错误 ![图片说明](https://img-ask.csdn.net/upload/201707/04/1499132530_552185.png)
POI读取Word文档总结
2010-02-01 10:20

shappy1978的博客 1 要解决表格,宏,超链接,图片等显示或者乱码问题，不能用类似WordExtractor的包或者试图用一个函数导出文本，没有现成的解决方案，必须用poi包一个段落一个段落的解析并处理一些特殊的格式。 2 现在对带数字或者...
java poi导出word之后再次对此wrod添加内容 eclipse java maven
2019-06-10 17:40

回答 1 已采纳 https://blog.csdn.net/javaxiaodou/article/details/78936989
用poi生成word文档，中间的这条粗线怎么生成。。 java
2022-08-20 13:09

回答 3 已采纳给你提供一种思路，使用word模版，然后通过poi根据模版生成文件，我给你提供的demo，poi jar包的版本是5.0.0。希望对你有用。 import org.apache.commons.lo
poi到处word的table中的单元格怎么创建table？
2017-10-13 03:45

回答 1 已采纳 http://download.csdn.net/download/huawei2010_2011_2012/4646537
【SpringBoot高级篇】SpringBoot整合POI和EasyExcel报表技术
2021-06-13 14:08

李熠漾的博客 SpringBoot整合EasyExcelEasyExcel介绍导出示例导入示例EasyExcel集成添加依赖写操作本地写web中的写读操作读取本地文件创建监听器读取web上传文件写到库中创建监听器 EasyExcel介绍 Java解析、生成Excel比较有名的...
java poi解析word问题，读取每段前自动生成的序号或目录结构 java
2014-12-11 08:46

回答 4 已采纳 https://my.oschina.net/u/3410302/blog/3048367 可以参考一下
poi word转html 图片问题
2017-01-04 08:47

回答 2 已采纳已经不需要解决了。。。。。。。。
JAVA 使用POI替换word中的某些字符串，在本地调试一切ok，在服务器上出现乱码 java
2019-04-18 14:12

回答 7 已采纳已经搞定，感谢上面大佬们的回复，确实是语言包的问题，因为word里面全弄的是微软雅黑这个字体，于是就单独把微软雅黑字体放进服务器，但是依旧是不行，于是我以为不是这个问题，今天实在是没招了，网上
Java生成word通报（使用echart、poi-tl、PhantomJS）
2018-08-16 16:30

坐在巨人肩膀上的博客 Java生成word通报（使用echart、poi-tl、PhantomJS）前段时间客户需要系统自动生成服务通报，word文档中要有图片、表格、文字。第一次做这种通报，项目经理又想用以前的方式，只好找新技术、新方法去实现这个功能...
poi根据模板导出word，模板也变了 java 后端有问必答
2023-03-09 17:37

回答 3 已采纳小魔女参考了bing和GPT部分内容调写:使用POI框架导出word文档，当模板发生变化时，需要重新编写代码。首先，使用POI框架需要导入相应的jar包，然后创建一个XWPFDocument对象，用于
Java实现根据Word模板填充表格数据（poi方式），以及doc和docx转PDF，最全最详细版本，解决外部引用jar在linux上报ClassNotFound的问题。
2022-03-22 16:41

和桃恋也的博客 Java实现根据Word模板填充表格数据（poi方式），以及doc和docx转PDF，最全最详细版本适用场景： 1.固定格式的Word模板 2.Word模板中所有需要填充的数据都使用【Word表格】包起来 3.包含简单和复杂数据填充，场景...
java操作word文档表格带有边框乱码问题
2012-11-20 10:16

技术脚印的博客乱码问题的解决问题的办法。希望对以后用到的小白corder用所帮助！首先，大家先要了解一下jacob ，官方的解释是Java COM Bridge，即java和 com组件间的桥梁，这里说说为什么我们用jacob操纵word。而不
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 11月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月21日

悬赏问题

¥15 poi合并多个word成一个新word,原word中横版没了.
¥15 【火车头采集器】搜狐娱乐这种列表页网址，怎么采集？
¥15 求MCSCANX 帮助
¥15 机器学习训练相关模型
¥15 Todesk 远程写代码 anaconda jupyter python3
¥15 我的R语言提示去除连锁不平衡时clump_data报错，图片以下所示，卡了好几天了，苦恼不知道如何解决，有人帮我看看怎么解决吗？
¥15 在获取boss直聘的聊天的时候只能获取到前40条聊天数据
¥20 关于URL获取的参数，无法执行二选一查询
¥15 液位控制，当液位超过高限时常开触点59闭合，直到液位低于低限时，断开
¥15 marlin编译错误，如何解决？

poi读取word部分乱码

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新