*细路籽 2021-05-07 12:42 采纳率: 100%
浏览 60
已采纳

用poi将docx转html但无法提取出图片

文字正常显示但没有提取出来图片 也没显示图片

以下是代码

import org.apache.poi.xwpf.converter.core.BasicURIResolver;
import org.apache.poi.xwpf.converter.core.FileImageExtractor;
import org.apache.poi.xwpf.converter.core.FileURIResolver;
import org.apache.poi.xwpf.converter.xhtml.XHTMLConverter;
import org.apache.poi.xwpf.converter.xhtml.XHTMLOptions;
import org.apache.poi.xwpf.usermodel.XWPFDocument;

import java.io.*;
import java.util.List;

public class DocxTransUtil {

    public static void trans2htm(String docxfile)throws Throwable{
        long startTime = System.currentTimeMillis();
        String fileName = docxfile.substring(docxfile.lastIndexOf("\\")+1);
        String file = fileName.substring(0,fileName.lastIndexOf("."));
        String path = DocxTransUtil.class.getResource("/").getPath()+"News/";
        XWPFDocument document = new XWPFDocument(new FileInputStream(docxfile));
        XHTMLOptions options = XHTMLOptions.create().indent(4);
        // 导出图片
        File imageFolder = new File(path);
        options.setExtractor(new FileImageExtractor(imageFolder));
        // URI resolver  word的html中图片的目录路径
        options.URIResolver(new FileURIResolver(imageFolder));
        File outFile = new File(path+file+".html");
        outFile.getParentFile().mkdirs();
        OutputStream out = new FileOutputStream(outFile);
        XHTMLConverter.getInstance().convert(document, out, options);
        System.out.println(path+"Generate " + path + " with " + (System.currentTimeMillis() - startTime) + " ms.");

    }

    }
  • 写回答

2条回答 默认 最新

  • 朱  2021-05-07 14:47
    关注

    楼上说的“深蓝”是啥?是冰蓝?他们应该就是spire.doc.jar,专门操作word的,word转html代码如下:

    import com.spire.doc.*;
    
    public class WordtoHtml {
        public static void main(String[] args) {
            Document  doc = new Document();
            doc.loadFromFile("样本.docx");
            doc.saveToFile("wordtohtml.html",FileFormat.Html);
            doc.dispose();
        }
    }
    

    以上环境使用版本为free spire.doc.jar 3.9.0即免费版

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 gwas 分析-plink 检查人口分层出现下面问题
  • ¥15 关于#matlab#的问题:需要 MATLAB 运行程序,对比四个多址通信方式(TDMA,FDMA,CDMA,OFDMA)的抗噪声性能
  • ¥15 有没有复现过PFENet的,如何解决?
  • ¥15 vue3使用swiper轮播图循环失败
  • ¥15 FDMA,OFDMA,TDMA 和 CDMA 系统容量对比仿真
  • ¥15 图神经网络的入侵检测
  • ¥15 工业数据采集技术+存储架构推荐
  • ¥15 GPT-SOVITS如何训练少数民族语言支持合成语音
  • ¥20 树莓派4b使用Camera Module 3时出现the system should be configured for the legacy camera stack问题
  • ¥200 GitHub开源程序配置在VScode调试