干塘村speecher 2019-04-10 20:56 采纳率: 100%
浏览 1064
已采纳

用POI读取docx doc文档样式时,当文档用标题(一级标题.....),其全篇字体都会变成-1,请教大神原因。

问题描述:用POI读取docx doc文档样式时,当文档用标题(一级标题.....),其全篇字体都会变成-1,请教大神原因。

预想效果:能获取含标题文档的样式(字体 字号 颜色等)

代码:

import java.io.FileInputStream;
import java.io.InputStream;
import java.util.List;

import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFParagraph;
import org.apache.poi.xwpf.usermodel.XWPFRun;
public class XwpfTest{
    public static void main(String[] args)throws Exception {
        InputStream is = new FileInputStream("D:\\test.docx");
        @SuppressWarnings("resource")
        XWPFDocument doc = new XWPFDocument(is);
        List<XWPFParagraph> paras = doc.getParagraphs();//将得到包含段落列表
        System.out.println("all data :" + paras.size());
        for(XWPFParagraph para : paras) {
            //当前段落的属性  
            //CTPPr pr = para.getCTP().getPPr(); 
            //System.out.println(para.getText());
            List<XWPFRun> runsLists = para.getRuns();//获取段楼中的句列表

            for(XWPFRun runsList : runsLists ){
                String c = runsList.getColor();//获取句的字体颜色
                float f = runsList.getFontSize();//获取句中字的大小
                String s = runsList.getText(0);//获取文本内容

                if(s != null) // 如果读取为非空,则对其进行判断
                {
                    if(s.contains("摘要"))// 识别摘要
                    {
                        System.out.println("right!");
                        runsList.setBold(true);
                    }
                    if(s.equals("摘要:")){
                        System.out.println("ddddddddddddddddddd");
                    }

                    if(s.contains("第一章")){
                        if(f != 16){
                            System.out.println("一级标题格式不是三号字体!");
                        }
                        System.out.println("一级标题!!!!!");
                    }
                }

                System.out.println("color:" + c);
                System.out.println("size:" + f);
                System.out.print("text:" + s);
                if(s != null){
                    System.out.print(",the length of string is " + s.length());
                }
                System.out.println("-----");
            }
        }
}
}

test.docx文档图片
test.docx文档样式

运行图片:
运行图片

  • 写回答

2条回答 默认 最新

  • 干塘村speecher 2019-04-13 18:32
    关注

    通过将word文档转成html文件,对html文件进行解析,获取相应的样式。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥20 为什么安装CSiBridge时出现了这个问题,尝试了很多方法都不行,求详细操作步骤?
  • ¥15 鼠标右键,撤销删除 复制 移动,要怎样删除
  • ¥15 使用MATLAB进行余弦相似度计算加速
  • ¥15 服务器安装php5.6版本
  • ¥15 我想用51单片机和数码管做一个从0开始的计数表 我写了一串代码 但是放到单片机里面数码管只闪烁一下然后熄灭
  • ¥20 系统工程中,状态空间模型中状态方程的应用。请猛男来完整讲一下下面所有问题
  • ¥15 我想在WPF的Model Code中获取ViewModel Code中的一个参数
  • ¥15 arcgis处理土地利用道路 建筑 林地分类
  • ¥20 使用visual studio 工具用C++语音,调用openslsx库读取excel文件的sheet问题
  • ¥100 寻会做云闪付tn转h5支付链接的技术