Jerry_BJ
JerryZhou_
2016-09-01 05:15
采纳率: 100%
浏览 2.9k
已采纳

java读取word内容显示在页面并保存数据库

java读取word内容显示在页面显示。并逐条保存数据库;类似于这样的
图片说明

目前用apache TiKa能把所有的内容读取出来 可是怎么分开抓取没有思路。。。

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 邀请回答

5条回答 默认 最新

  • lishihong108
    lishihong108 2016-09-01 05:22
    已采纳

    1.把word转出html格式的文本http://jingyan.baidu.com/article/14bd256e2d1301bb6d26122e.html
    2.用java的io流读取文件,web和h5直接展示html;android或者ios用webview加载这个html;
    3.存数据库的话也可以直接存这个html格式的

    点赞 评论
  • Mr_dsw
    Antway_ 2016-09-01 05:34

    读文本本质都是流,你要想区分题目,肯定要有个标志,将流输出为string进行区分。

    点赞 评论
  • CSDN_ZOL
    csdn_ZOL 2016-09-01 08:37
    
    public class TestThread {
    
        public static void main(String[] args) throws Exception {
    
            BufferedReader br = new BufferedReader(new FileReader("D:\\work\\word.txt"));
    
            String line = "";
            String allWord = "";
            while((line=br.readLine())!=null){
    
                if(line.startsWith("表现形式")){
                    // 将这道题目的末尾加上标志   =====  。唯一可识别的记号
                    allWord =   line + "=====" ;
                }
            }
    
            String every [] = allWord.split("=====");
    
            for (String string : every) {
                //逐条插入数据库
            }
        }
    }
    

    只是伪代码。望采纳

    点赞 评论
  • u010883376

    每个题目、答案等存储部位 用个标签标识 然后直接转xml字符串 再用DOM4j解析,存到自定义的对象里面再遍历存数据库就好了

    点赞 评论
  • ganyao939543405
    OSTCB 2016-09-11 03:10

    java有个poi库 你百度一下 可以转成html html是文本就可以保存到数据库

    点赞 评论

相关推荐