在做一个信息提取的项目,需要提取几万份文件中的特定数据(每份文件大概是两百页左右的PDF),现在已经可以提取出其中一份文件中的特定数据了。
问:现在要怎样提取几万份文件中的特定数据?
用的是Java,据说要用多线程,不知道是不是,如果是的话,具体要怎么用?
Java中处理大数据的问题
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答
- little_how 2016-04-25 05:47关注
开线程可能会造成内存溢出的问题,这样的任务应该交给多台服务器多个线程来处理,这样又快又安全。
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报