识别PDF中的表格现在做到了什么程度？

解析PDF中的表格除了pdfminer、tabula、pdfplumber 这三种Python库，还有其他较好的Python库吗？PDF中的表格识别现在做到了那种程度？可以识别成有用的数据吗？（可以让表格输出为有规律的文本或者形成字典吗）

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2019-03-18 00:10
关注
商业的话，可以用某些云计算的paas服务，在线识别。人家是针对各种样本调优过的，效果肯定比你简单用几个库好很多。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

dify智能体-LLM批量识别PDF电子发票信息生成excle表格.yml
2025-07-27 09:29

随着科技的进步，尤其是人工智能技术的飞速发展，这一任务可以得到极大的简化。dify智能体-LLM批量识别PDF电子发票信息生成Excel表格.yml正是为了满足这一需求应运而生。它不仅能够高效地从PDF文件中提取发票信息，...
AI人工智能，人工智能OCR识别项目，支持识别PDF文件中的表格，文字和表格识别，身份证信息提取等
2025-02-13 21:43

人工智能OCR技术的应用使得从PDF中提取文字和表格变得可能，用户不再需要耗费大量时间手动输入或复制粘贴，提高了工作效率。此外，该项目还支持身份证信息提取，这是一个特别重要的功能。身份证作为个人身份的重要...
Dify智能体：票据识别+飞书多维表格.yml
2025-07-30 22:46

随着人工智能技术的不断进步，自动化票据识别技术应运而生，极大地方便了信息的整理和管理。Dify智能体的出现，将票据识别技术与飞书多维表格进行整合，实现了一种高效、智能的数据处理方案。 Dify智能体的票据识别...
AI如何理解PDF中的表格和图片？
2025-09-02 15:59

TextIn智能文档云平台的博客 AI的重要性已渗透到社会、经济、科技、生活等几乎所有领域，其核心价值在于突破人类能力的物理与认知边界，通过数据驱动的自动化、智能化与优化，解决复杂问题、提升效率并创造全新可能性。另外，TextIn识别能力，...
人工智能-大模型-PDF解析（文字，章节，表格，图片，参考），基于大模型(ChatGLM2-6B, RWKV)+langchai
2024-10-21 11:12

PDF解析（文字，章节，表格，图片，参考），基于大模型(ChatGLM2-6B, RWKV)+langchain+streamlit的PDF问答，摘要，信息抽取介绍实现对PDF解析，将给定的PDF结构化成以下几个部分。文字总标题，章节标题和章节...
免费AI神器！完美提取识别扫描版PDF文件中的表格内容
2024-05-23 07:21

AIGCTribe的博客现在已经有一些工具软，可以识别扫描版PDF文件中的表格，但是效果差强人意，会有很多错误，还需要进行很多修改。很完美的提取出来，点击右上角的复制代码，然后粘贴到Arya - 在线 Markdown 编辑器。输入提示词：提取...
python调用百度ai/腾讯云将图片/pdf识别为表格excel
2023-07-24 21:36

飞得更高肥尾沙鼠的博客 python调用百度ai将图片识别为表格excel
openai 识别输入的PDF文件
2023-06-29 11:22

OpenAI是一家专注于人工智能研究、开发和应用的公司，他们提供了一系列的AI模型，例如GPT（Generative Pre-trained Transformer），这些模型在自然语言处理（NLP）任务上表现出色。在这个场景下，"识别输入的PDF...
PDF-识别并读取PDF中的文字.zip
2024-10-28 11:36

在信息技术迅猛发展的今天，对数字化文档的处理变得越来越重要。PDF（便携式文档格式）作为广泛使用的一种文件格式，...未来，随着人工智能和机器学习技术的进步，我们可以期待PDF文字识别技术将更加智能、高效和准确。
如何使用程序通过OCR识别解析PDF中的表格
2024-02-27 20:03

水的精神的博客一、Paddle-structure是目前我们能找到的可以做中英文版面分析较好的一个基础模型，其开源版可以识别十类页面元素。这篇文章介绍演示如何使用。pdf的解析大体上有两条路，一条是基于规则，一条是基于AI。所谓基于...
没有解决我的问题, 去提问

识别PDF中的表格现在做到了什么程度？

2条回答 默认 最新

2条回答默认最新