如何使用PHP从PDF文件中提取文本？

I know there are a lot of PDF extraction methods/techniques, but I'm after a reliable text extractor for PDFs in PHP. All I want is to extract words, but not numbers and no special characters.

Any ideas of solid techniques to achieve this?

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
duanque3125 2012-11-21 13:28
关注
The Zend Framework provides Zend_Pdf, a php class that will load and parse pdf documents.

Here is a script that shows how to extract the text from a loaded Zend_Pdf object.

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

编辑

预览

报告相同问题？

关注问题

如何读取PDF文件中的印章？ java
2019-07-02 08:02

回答 4 已采纳有关 pdf 印章的操作，可以用 pageoffice 。
使用PHP验证查找恶意PDF文件？ javascript php
2016-09-21 03:28

回答 3 已采纳 Take a look into this project https://github.com/urule99/jsunpack-n - A Generic JavaScript Unpacke
如何使用php将keynote文件转换为PDF文件？ php
2019-02-28 22:33

回答 1 已采纳 We can use api code of https://cloudconvert.com/ for convert file.
php 获取pdf中的文字,php – 如何从PDF文档中提取文本？
2021-04-12 10:50

weixin_39710179的博客下载class.pdf2text.php @http://pastebin.com/dvwySU1a(更新日期：2014年4月5日)或http://www.phpclasses.org/browse/file/31030.html(需要注册)码：include('class.pdf2text.php');$a = new PDF2Text();$a->...
使用php将mysql中的数据打印成pdf文件 mysql php
2018-02-17 10:02

回答 1 已采纳 This line $pdf->SetFont('','',12); sets your font to current font. But you didn't set any
如何从Android中的php URL下载PDF文件？ android java php
2015-05-21 09:44

回答 1 已采纳 getContentLength() uses the Content-Length header which, according to Google Chrome's Dev Tools, y
PHP - 从链接下载pdf文件并保存在本地文件夹中 php
2017-10-26 22:42

回答 3 已采纳 It is not clear what exactly you are doing and why your php script has to recognize pdf. If you a
PdfParser一个独立的PHP库提供从PDF文件中提取数据的各种工具
2019-08-07 23:40

1. **数据提取**：PdfParser能够解析PDF文件的结构，从中提取文本、图像、元数据等信息。这对于需要从大量PDF文档中抓取特定信息的应用场景非常有用，比如数据分析、文档检索或内容索引。 2. **解析器**：库内包含...
如何从php文件中获取多页pdf输出？ php
2015-05-11 02:30

回答 1 已采纳 The message : fatal error allowed memory size of bytes exhausted is telling you to increase the
使用PHP将PDF保存为数据库中的blob？ database php
2017-03-28 05:55

回答 1 已采纳 $fp = fopen($fileLocation, 'r'); $content = fread($fp, filesize($fileLocation)); $content = addsla
使用PHP从数据库下载PDF文件[复制] mysql php
2014-12-02 21:53

回答 2 已采纳 See this solution, reproduced here: Adding ob_clean(); and flush(); functions before the readf
pdf-to-text:从pdf提取文本
2021-05-25 05:28

从pdf提取文本该软件包提供了一个从pdf提取文本的类。 use Spatie \ PdfToText \ Pdf ; echo Pdf :: getText ( 'book.pdf' ); //returns the text from the pdf Spatie是一家位于比利时安特卫普的网页设计机构...
php 提取文字,如何使用PHP从word文档中提取文本内容？
2021-03-23 12:37

芳奎的博客我想用PHP从word文档中提取文本内容.我在Microsoft Word for Mac 2011中创建了一个新的单词文档.编辑：也通过在Windows 7中的Microsoft Word中创建相同的文档进行测试.文件的内容是The quick brown fox jumps over ...
PdfParser，一个独立PHP库，提供了多种工具来从PDF文件提取数据。-PHP开发
2021-05-26 23:42

PdfParser Pdf Parser，一个独立PHP库，提供了多种工具来从PDF文件提取数据。网站：http://www.pdfparser.org在我们的演示页面上测试API。该项目由Actualys支持。 PdfParser Pdf Parser，一个独立PHP库，提供了...
没有解决我的问题, 去提问

如何使用PHP从PDF文件中提取文本？

1条回答 默认 最新

1条回答默认最新