renjian1995 2017-09-25 07:22 采纳率: 0%
浏览 4817

java poi读取word2003,WordExtractor无法识别doc文档

poi版本是poi-3.17
具体报错如下:
java.lang.IllegalArgumentException: The document is really a UNKNOWN file
at org.apache.poi.hwpf.HWPFDocumentCore.verifyAndBuildPOIFS(HWPFDocumentCore.java:123)
at org.apache.poi.hwpf.extractor.WordExtractor.(WordExtractor.java:51)
at ETDemo.readWord(ETDemo.java:24)
at ETDemo.main(ETDemo.java:56)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:498)
at com.intellij.rt.execution.application.AppMain.main(AppMain.java:147)
代码如下:
String text = "";
File file = new File(filePath);
//2003
if(file.getName().endsWith(".doc")){

        try {
            FileInputStream stream =null;
            stream=new FileInputStream(file);
            WordExtractor word = new WordExtractor(stream);
  • 写回答

2条回答

  • threenewbee 2017-09-25 16:03
    关注

    看你的文件的格式是否被WordExtractor 支持。是不是word2003的,还是别的格式,用了doc后缀

    评论

报告相同问题?

悬赏问题

  • ¥15 使用Jdk8自带的算法,和Jdk11自带的加密结果会一样吗,不一样的话有什么解决方案,Jdk不能升级的情况
  • ¥15 画两个图 python或R
  • ¥15 在线请求openmv与pixhawk 实现实时目标跟踪的具体通讯方法
  • ¥15 八路抢答器设计出现故障
  • ¥15 请教一下c语言的代码里有一个地方不懂
  • ¥15 opencv 无法读取视频
  • ¥15 用matlab 实现通信仿真
  • ¥15 按键修改电子时钟,C51单片机
  • ¥60 Java中实现如何实现张量类,并用于图像处理(不运用其他科学计算库和图像处理库))
  • ¥20 5037端口被adb自己占了