龙飞腾达 2022-06-15 11:10 采纳率: 0%
浏览 163

使用POI读取word文件报错

问题遇到的现象和发生背景

今天我在用POI读取word文件 doc 报错146146

问题相关代码,请勿粘贴截图
/**
     * 获取正文文件内容,doc方法
     *
     * @param input
     * @return
     */
    public List<String> getContentDoc(InputStream input) {
        List<String> list = new ArrayList<>();
        try {
            // 2003版本的word
            WordExtractor extractor = new WordExtractor(input);  // 2003版本 仅doc格式文件可处理,docx文件不可处理
            String[] paragraphText = extractor.getParagraphText();   // 获取段落,段落缩进无法获取,可以在前添加空格填充
            if (paragraphText != null && paragraphText.length > 0) {
                for (String paragraph : paragraphText) {
                    if (!paragraph.startsWith("    ")) {
                        list.add(paragraph + "\r\n");
                    } else {
                        list.add(paragraph);
                    }
                }
            }
        } catch (Exception e) {
            e.printStackTrace();
            log.error("doc解析正文异常:" + e);
            throw new ServiceProcessException(e.getMessage());
        } finally {
            if (input != null) {
                try {
                    input.close();
                } catch (IOException e) {
                    e.printStackTrace();
                    log.error("" + e);
                }
            }
        }
        return list;
    }

运行结果及报错内容

img

我的解答思路和尝试过的方法

WordExtractor extractor = new WordExtractor(input);
这段代码报错,是不是不支持这个word文档类型,我怀疑这个文档是通过其他文件转过来的

我想要达到的结果

请问大家遇到过这种错误吗?

  • 写回答

1条回答 默认 最新

  • nuclear2011 2022-06-16 11:00
    关注
    评论

报告相同问题?

问题事件

  • 创建了问题 6月15日

悬赏问题

  • ¥15 关于#hadoop#的问题
  • ¥15 (标签-Python|关键词-socket)
  • ¥15 keil里为什么main.c定义的函数在it.c调用不了
  • ¥50 切换TabTip键盘的输入法
  • ¥15 可否在不同线程中调用封装数据库操作的类
  • ¥15 微带串馈天线阵列每个阵元宽度计算
  • ¥15 keil的map文件中Image component sizes各项意思
  • ¥20 求个正点原子stm32f407开发版的贪吃蛇游戏
  • ¥15 划分vlan后,链路不通了?
  • ¥20 求各位懂行的人,注册表能不能看到usb使用得具体信息,干了什么,传输了什么数据