摇摇马 2020-04-20 18:28 采纳率: 33.3%
浏览 600

怎么识别一个经过base64转码过的PDF文件里面的文字内容?

因为需要,在数据库中存的PDF文件是经过转码后的base64字符串,现在想取出来解析pdf里的内容
有没有大佬可以给点思路。

  • 写回答

1条回答 默认 最新

  • threenewbee 2020-04-20 21:02
    关注

    首先base64解码,保存字节成pdf文件
    然后用itext这个库读取
    如果内容是图片,还需要ocr

    评论

报告相同问题?

悬赏问题

  • ¥15 msix packaging tool打包问题
  • ¥15 finalshell节点的搭建代码和那个端口代码教程
  • ¥15 用hfss做微带贴片阵列天线的时候分析设置有问题
  • ¥50 我撰写的python爬虫爬不了 要爬的网址有反爬机制
  • ¥15 Centos / PETSc / PETGEM
  • ¥15 centos7.9 IPv6端口telnet和端口监控问题
  • ¥120 计算机网络的新校区组网设计
  • ¥20 完全没有学习过GAN,看了CSDN的一篇文章,里面有代码但是完全不知道如何操作
  • ¥15 使用ue5插件narrative时如何切换关卡也保存叙事任务记录
  • ¥20 海浪数据 南海地区海况数据,波浪数据