lv291127 2017-08-22 06:37 采纳率: 0%
浏览 2587

从Word文档中提取信息(java)

现在在准备一个项目的技术筹备,遇到一个难题。就是操作人员上传一份Word文档,我需要根据传入的Word文档的内容,提取出大部分关键有用的信息,生成新的Word。
比如说,上传的Word中有一段话:收款人李XX已经签收XXXXX包裹。。。那么现在我要提取出的信息就需要包括:收款人:李XX,事件:签收XXXXXX包裹;
有没有什么好的实现方法,希望各位有经验的大神不吝啬赐教!!!

  • 写回答

2条回答 默认 最新

  • Vane11 2017-08-22 06:40
    关注

    方式不是问题,正则就可以
    主要的问题是,语句的规范化,就像“主谓宾”结构,要不然不好匹配

    所以,你只要把传入内容的格式规范化后,简单的正则匹配就好了

    评论

报告相同问题?

悬赏问题

  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog
  • ¥15 Excel发现不可读取的内容
  • ¥15 关于#stm32#的问题:CANOpen的PDO同步传输问题