DataWizardess 2025-06-29 13:25 采纳率: 98.5%

已采纳

如何提取Azure AI Document Intelligence中的表格数据？

**如何从Azure AI Document Intelligence中提取复杂嵌套表格的数据？** 在使用Azure AI Document Intelligence（之前称为Form Recognizer）处理包含嵌套结构的表格文档时，开发者常遇到无法准确提取嵌套单元格内容或结构错位的问题。尽管该服务支持对自定义表单进行训练和识别，但在面对多行合并、跨页表格或非均匀列数的复杂表格时，API返回的数据结构可能不完整或层级混乱。你是否在实际项目中也遇到了此类问题？又是如何通过调整模型训练策略、解析逻辑或后处理代码来解决这些挑战的？欢迎分享你的经验和最佳实践。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

fafa阿花 2025-10-21 22:51

关注

一、引言：Azure AI Document Intelligence 的表格提取挑战

Azure AI Document Intelligence 是微软提供的文档分析服务，能够从扫描文档或PDF中提取文本、键值对以及表格数据。然而，在处理包含嵌套结构的复杂表格时，开发者常遇到以下问题：

单元格跨行或跨列合并导致层级混乱
表格内容分布在多个页面上
列数不一致或非均匀布局
嵌套子表结构识别失败

这些问题往往导致API返回的数据结构无法直接使用，需要通过模型训练优化与后处理逻辑来修复。

二、理解 Azure AI Document Intelligence 表格输出结构

在开始处理之前，必须深入理解其输出格式。Document Intelligence 返回的 JSON 包含如下关键字段：


{
  "tables": [
    {
      "rows": number,
      "columns": number,
      "cells": [
        {
          "rowIndex": number,
          "columnIndex": number,
          "text": string,
          "boundingBox": [x1,y1,x2,y2,...],
          "isHeader": boolean
        },
        ...
      ]
    }
  ]
}

每个单元格（cell）记录了所在行和列的位置信息，但没有显式表示“嵌套”结构。因此，解析器需要根据这些原始数据重建嵌套关系。

三、训练策略优化：提升模型识别精度

为了提高嵌套表格的识别准确率，可以采用以下训练策略：

标注高质量样本：确保训练集中包含大量嵌套表格的真实示例，并正确标注所有单元格位置。
使用多页文档进行训练：避免只用单页表格训练模型，以增强跨页连续识别能力。
强制定义表格边界：使用自定义模型训练中的标签工具明确标出表格范围，减少干扰。
启用 Layout 模型预处理：在训练前先运行 Layout 模型，帮助识别文档结构并辅助标注。

训练过程中，应持续验证模型在不同复杂度表格上的表现，并调整训练参数如迭代次数、学习率等。

四、解析逻辑重构：构建嵌套表格结构

即使模型输出完整，仍需编写逻辑代码将扁平化的 cells 转换为嵌套结构。以下是常见步骤：


function buildNestedTable(cells) {
  const rows = {};
  cells.forEach(cell => {
    if (!rows[cell.rowIndex]) rows[cell.rowIndex] = [];
    rows[cell.rowIndex][cell.columnIndex] = cell.text;
  });
  return Object.values(rows);
}

对于嵌套子表，可基于单元格内容特征判断是否为“容器”，然后递归解析其中的新表格。

例如，如果某单元格内容包含“子表”字样，则尝试在其内部再次调用表格解析函数。

五、后处理技巧：修复错位与缺失结构

由于 OCR 和模型识别误差，部分单元格可能未被正确识别或位置偏移。以下是常见的后处理方法：

问题类型	解决方法
跨行/跨列未合并	基于 boundingBox 计算相邻单元格距离，自动合并接近区域
遗漏单元格	使用图像处理技术检测空白区域是否存在文字
结构错乱	基于行列索引重新排序并填充空缺位置

此外，也可以引入 NLP 技术识别表头含义，从而更智能地组织数据结构。

六、流程图展示：整体解决方案架构

graph TD
A[上传文档] --> B{是否为复杂嵌套表格?}
B -- 是 --> C[运行Layout模型预处理]
C --> D[人工标注训练集]
D --> E[训练自定义模型]
E --> F[调用模型识别]
F --> G[解析JSON输出]
G --> H{是否结构正确?}
H -- 否 --> I[应用后处理算法]
H -- 是 --> J[输出结构化数据]
I --> J

该流程图展示了从文档输入到最终输出结构化数据的全过程，强调了训练、解析与后处理的重要性。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

AI工具-使用 Azure AI Document Intelligence 创建智能文档处理
2024-06-14 11:42

Carrie_Lei的博客通常，AI 需要大量示例数据来训练模型，但 Microsoft 提供了一些已经训练好的模型。你可以直接使用这些预生成模型来处理常见表单，如发票和收据，而无需训练自己的模型。发票模型。提取发票中的常见字段和数值。收据...
使用Azure AI Document Intelligence进行智能文件处理
2024-10-22 23:25

ahdfwcevnhrtds的博客 Azure AI Document Intelligence提供了强大的文档处理能力。通过不同的模式和高级功能，用户可以灵活地处理各种文档格式。要深入了解更多使用指南和概念指南，请参考Azure的相关文档。
使用Azure AI Document Intelligence提取文档内容：从PDF到结构化数据
2024-08-28 20:37

llzwxh888的博客 Azure AI Document Intelligence是一个基于机器学习的服务，能够从各种文档中提取文本（包括手写内容）、表格、文档结构（如标题、章节标题等）以及键值对。它支持多种文件格式，包括PDF、JPEG/JPG、PNG、BMP、TIFF...
使用Azure AI Document Intelligence进行文档智能解析
2025-06-18 09:36

zbb258的博客 Azure AI Document Intelligence（前身为Azure Form Recognizer）通过机器学习技术从数字化或扫描的PDF、图像、Office、HTML文件中提取文本（包括手写文本）、表格、文档结构（如标题、章节标题等）以及关键值对。...
探索Azure AI Document Intelligence的强大功能
2025-06-30 12:55

2501_92325368的博客 Azure AI Document Intelligence（前称Azure Form Recognizer）是一项基于机器学习的服务，能够从数字化或扫描的PDF、图像、Office和HTML文件中提取文本（包括手写）、表格、文档结构（如标题、章节标题等）和关键值...
自动化文档处理：Azure AI Document Intelligence
2024-12-30 16:25

Mia@的博客 Azure AI 文档智能读取模型可以从文档和图像中提取印刷和手写文本。这是所有其他预生成模型的基础，用于提供文本提取功能。常规文档模型扩展了读取模型的功能，能够提取键值对、实体、选择标记和表格数据。它。实体...
探索Azure AI Document Intelligence：从文档到数据的高效转换
2024-11-27 20:22

dsndnwfk的博客 Azure AI Document Intelligence是一个强大而灵活的工具，适用于各种文档处理任务。通过结合使用LangChain和其他工具，我们可以更轻松地将文档内容转化为可供分析的数据。如果您想更深入了解文档加载器的用法，可以...
探索Azure AI Document Intelligence: 提取文档信息的智能助手
2024-12-14 13:31

aGRGWRF的博客通过Azure AI Document Intelligence，开发者能够高效地从多种格式的文档中提取结构化信息，实现智能文档解析。Azure文档智能加载器概念指南LangChain文档加载器使用指南。
轻松解析复杂文档：Azure AI Document Intelligence 的强大功能和实践
2024-12-03 17:09

adfyvatbia的博客 Azure AI Document Intelligence 提供了一种强大且灵活的方式来解析各种复杂文档。无论是提取文本还是识别文档结构，该工具都能显著提高文档处理的效率。Azure AI Document Intelligence 官方文档LangChain 文档加载...
使用Azure AI Document Intelligence提取文档信息的完整指南
2024-12-06 15:57

sfsdhttdk的博客 Azure AI Document Intelligence是一个强大的文档分析工具，尤其在处理复杂文档时表现出色。通过结合LangChain，用户可以将提取的信息无缝集成到不同的应用中。有关更详细的用法，请参阅文档加载器的概念指南。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月29日