使用java如何读取doc文件,保证不会乱码
7条回答
- fxhu09 2014-04-18 15:37关注
如果不需要把图片读取出来,可以用下面的方法
public static void testWord1(){
try {
//word 2003: 图片不会被读取
InputStream is = new FileInputStream(new File("c:\a.doc"));
WordExtractor ex = new WordExtractor(is);
String text2003 = ex.getText().trim();
System.out.println(text2003);
//word 2007 图片不会被读取, 表格中的数据会被放在字符串的最后
// OPCPackage opcPackage = POIXMLDocument.openPackage("c:\a.doc");
// POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);// String text2007 = extractor.getText(); //System.out.println(text2007); } catch (Exception e) { e.printStackTrace(); }
如果是word2003用前半部分
如果是2007用后半部分本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥30 这是哪个作者做的宝宝起名网站
- ¥60 版本过低apk如何修改可以兼容新的安卓系统
- ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
- ¥50 有数据,怎么建立模型求影响全要素生产率的因素
- ¥50 有数据,怎么用matlab求全要素生产率
- ¥15 TI的insta-spin例程
- ¥15 完成下列问题完成下列问题
- ¥15 C#算法问题, 不知道怎么处理这个数据的转换
- ¥15 YoloV5 第三方库的版本对照问题
- ¥15 请完成下列相关问题!