问题遇到的现象和发生背景
应用场景:合同文本识别+数据结构化;
问题:合同框架结构相同,但由于条款描述篇幅不同,导致同一个信息在合同文本出现的位置不同,但表述方式不变时,会影响该项数据的识别吗?
例子:比如 收款账号: 510...3333 这个条款,第一个合同出现在第三页的末端; 第二个同类合同(结构相同)该项条款出现在了第四页上方;在使用OCR+NLP识别的时候,会影响对此项数据的识别吗?
操作环境、软件版本等信息
尝试过的解决方法
我想要达到的结果
请专业的朋友回答,谢谢。
应用场景:合同文本识别+数据结构化;
问题:合同框架结构相同,但由于条款描述篇幅不同,导致同一个信息在合同文本出现的位置不同,但表述方式不变时,会影响该项数据的识别吗?
例子:比如 收款账号: 510...3333 这个条款,第一个合同出现在第三页的末端; 第二个同类合同(结构相同)该项条款出现在了第四页上方;在使用OCR+NLP识别的时候,会影响对此项数据的识别吗?
请专业的朋友回答,谢谢。
如果你的合同是格式合同,那你就应该先把它按章节分割,章节号和章节名这些都是固定的,直接字符串查找都行
然后你的识别应该识别里面的内容,而不是什么乱七八糟的都用它识别
毕竟它不是能自己写论文的那个人工智能,没那么智能