Tatsumi_zyy 2021-05-29 10:42 采纳率: 0%
浏览 43

pdf 转word java代码

想要pdf 转word  java代码,目前我已经实现各种文件转pdf了

  • 写回答

3条回答 默认 最新

  • CSDN专家-sinJack 2021-05-29 10:53
    关注

    import java.io.File;
    import java.io.FileOutputStream;
    import java.io.IOException;
    import java.io.OutputStreamWriter;
    import java.io.Writer;

    import org.apache.pdfbox.pdmodel.PDDocument;
    import org.apache.pdfbox.util.PDFTextStripper;

    public class PdfToWord{
        public static void main(String[] args){
            try{
                String pdfFile = "C:/xxxxx.pdf";
                PDDocument doc = PDDocument.load(new File(pdfFile));
                int pagenumber = doc.getNumberOfPages();
                pdfFile = pdfFile.substring(0, pdfFile.lastIndexOf("."));
                String fileName = pdfFile + ".doc";
                File file = new File(fileName);
                if (!file.exists()){
                file.createNewFile();
                }
                FileOutputStream fos = new FileOutputStream(fileName);
                Writer writer = new OutputStreamWriter(fos, "UTF-8");
                PDFTextStripper stripper = new PDFTextStripper();
                stripper.setSortByPosition(true);// 排序
                stripper.setStartPage(1);// 设置转换的开始页
                stripper.setEndPage(pagenumber);// 设置转换的结束页
                stripper.writeText(doc, writer);
                writer.close();
                doc.close();
                System.out.println("pdf转换word成功!");
            }
            catch (IOException e){
                e.printStackTrace();
            }
        }
    }  

    代码所用到的jar包 pdfbox-1.8.2.jar 另行下载,也可以私信我发给你

     

     

    评论

报告相同问题?

悬赏问题

  • ¥15 无法输出helloworld
  • ¥15 高通uboot 打印ubi init err 22
  • ¥20 PDF元数据中的XMP媒体管理属性
  • ¥15 R语言中lasso回归报错
  • ¥15 网站突然不能访问了,上午还好好的
  • ¥15 有没有dl可以帮弄”我去图书馆”秒选道具和积分
  • ¥15 semrush,SEO,内嵌网站,api
  • ¥15 Stata:为什么reghdfe后的因变量没有被发现识别啊
  • ¥15 振荡电路,ADS仿真
  • ¥15 关于#c语言#的问题,请各位专家解答!