mytest911
2013-07-23 22:49
浏览 426
已采纳

pdfbox

各位好:
我需要实现的功能如下:
获取pdf文件中的图片,然后根据这个图片,获取图片上下两行的文本数据。

目前可以提取,每一页的图片,和他的文本信息。但是无法定位到 上下两行。

有没有大虾做过的,或者给他建议。

我找api 找了很久, 但是由于英文很烂,pdfbox的对象模型太多了。也没找到一个从上到下遍历一个页面 的方法。

  • 写回答
  • 好问题 提建议
  • 追加酬金
  • 关注问题
  • 邀请回答

1条回答 默认 最新