各位好:
我需要实现的功能如下:
获取pdf文件中的图片,然后根据这个图片,获取图片上下两行的文本数据。
目前可以提取,每一页的图片,和他的文本信息。但是无法定位到 上下两行。
有没有大虾做过的,或者给他建议。
我找api 找了很久, 但是由于英文很烂,pdfbox的对象模型太多了。也没找到一个从上到下遍历一个页面 的方法。
各位好:
我需要实现的功能如下:
获取pdf文件中的图片,然后根据这个图片,获取图片上下两行的文本数据。
目前可以提取,每一页的图片,和他的文本信息。但是无法定位到 上下两行。
有没有大虾做过的,或者给他建议。
我找api 找了很久, 但是由于英文很烂,pdfbox的对象模型太多了。也没找到一个从上到下遍历一个页面 的方法。