批量将腾讯云的OCR识别结果写入导出的表格

我是零基础用户，想请教一下，我这个代码在Python跑完没有将腾讯云的OCR识别结果写入导出的表格里面是什么问题，我想用来批量识别微信支付的订单截图，谢谢！


```python
import json
import base64
import logging
import os
import pandas as pd
from tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException
from tencentcloud.ocr.v20181119 import ocr_client, models

# 腾讯云OCR服务的密钥和区域
secret_id = "***"
secret_key = "***"
region = "ap-guangzhou"

# 图片文件夹路径
image_folder_path = "D:/报销"

# 实例化一个认证对象
cred = credential.Credential(secret_id, secret_key)

# 实例化一个http选项
httpProfile = HttpProfile()
httpProfile.endpoint = "ocr.tencentcloudapi.com"

# 实例化一个client选项
clientProfile = ClientProfile()
clientProfile.httpProfile = httpProfile

# 实例化OCR client对象
client = ocr_client.OcrClient(cred, region, clientProfile)

# 创建一个空的DataFrame来存储结果
results_df = pd.DataFrame(columns=["文件名", "金额", "支付时间", "商户全称", "交易单号"])

# 遍历文件夹中的图片文件
for filename in os.listdir(image_folder_path):
    if filename.lower().endswith((".jpg", ".jpeg", ".png", ".bmp", ".tiff", ".tif")):
        file_path = os.path.join(image_folder_path, filename)
        logging.info(f"正在处理文件: {filename}")

        try:
            # 读取并编码图片为Base64字符串
            with open(file_path, "rb") as image_file:
                image_base64 = base64.b64encode(image_file.read()).decode('utf-8')

                # 实例化一个请求对象并设置请求参数
            req = models.SmartStructuralOCRV2Request()
            req.ItemNames = ["金额", "支付时间", "商户全称", "交易单号"]
            req.ImageBase64 = image_base64

            # 发送请求并获取响应
            resp = client.SmartStructuralOCRV2(req)

            # 解析响应结果
            response_data = json.loads(resp.to_json_string())
            ocr_data = response_data.get('Data', {}).get('Items', [])

            if ocr_data and isinstance(ocr_data, list) and len(ocr_data) > 0:
                result_item = ocr_data[0]  # 这里只取第一个结果作为示例
                result_dict = {key: result_item.get(key, '') for key in ["金额", "支付时间", "商户全称", "交易单号"]}
                result_dict["文件名"] = filename
                results_df = results_df.append(result_dict, ignore_index=True)

        except TencentCloudSDKException as err:
            logging.error(f"处理文件 {filename} 时出错: {err}")
        except Exception as e:
            logging.error(f"处理文件 {filename} 时发生意外错误: {e}")

        # 将结果DataFrame保存为Excel文件
desktop_path = os.path.join(os.path.expanduser('~'), 'Desktop')
output_file_path = os.path.join(desktop_path, "OCR_Results.xlsx")
results_df.to_excel(output_file_path, index=False)
logging.info(f"OCR结果已保存至 {output_file_path}")

```

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
无疆76 2024-10-18 18:59
关注
以下回复参考：皆我百晓生、券券喵儿等免费微信小程序作答:

你的代码看起来大体是正确的，它应该能正确地从腾讯云OCR服务获取识别结果并将结果存储在一个Pandas DataFrame中。然后，这个DataFrame会被保存为一个Excel文件。然而，如果在运行代码后并没有将腾讯云的OCR识别结果写入导出的表格，可能有以下几个原因：

文件路径问题：确保你的图片文件夹路径（image_folder_path）是正确的，并且确保你有权限访问这些文件。另外，也要确保你有权限在桌面上创建和写入文件。
腾讯云OCR服务的问题：确保你的腾讯云OCR服务正在正常运行，并且你的秘钥（secret_id 和 secret_key）是正确的。同时，检查你的代码中的区域（region）设置是否正确。
异常处理：你的代码对腾讯云SDK异常和其他异常进行了处理，这很好。但是，如果发生异常，可能会影响到后续的代码执行。确保异常处理后的代码（特别是将结果写入Excel的部分）在异常发生后仍能正确执行。
数据解析问题：腾讯云的OCR服务返回的JSON数据格式可能会影响到你的解析逻辑。你需要确保response_data.get('Data', {}).get('Items', [])这部分代码能够正确获取到OCR的结果。如果返回的数据结构发生变化，你可能需要调整这部分代码以适应新的数据结构。
Excel文件保存问题：确认你的程序有权限在桌面上创建和写入文件。有时，由于权限问题，文件可能无法成功保存。你可以尝试将文件保存到其他已知有写入权限的目录中，然后再移动到你想要的位置。

你可以尝试以上步骤来解决问题。如果问题仍然存在，你可能需要更详细地检查代码和错误日志以找出问题的根源。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

个人永久性免费-Excel催化剂功能第86波-人工智能之图像OCR文本识别全覆盖
2019-09-26 00:27

aoxikui0458的博客在上一年中，Excel催化剂已经送上一波人工智能系列功能，鉴于部分高端用户的需求，再次给予实现了复杂的图像OCR识别，包含几乎所有日常场景，让公司个人手头的图像非结构化数据瞬间变为可进行结构化处理分析的文本...
【审计专栏-监督监管领域】【信息科学与工程学】【管理科学】第五十一篇企业与企业/个人/家庭/财团的利益绑定与交换类型第二章 ICT公司01
2026-03-17 09:18

flyair_China的博客 ICT-0004 ICT数据库公司竞争与定价企业与企业 (开源数据库/云厂商数据库) 博弈：面对开源数据库（如PostgreSQL, MySQL）和云厂商自研数据库的上下夹击，采用“免费增值+开源核心”组合拳：将单机版或功能受限版...
【信息科学与工程学】【管理科学】【运营科学】第四十篇互联网广告公司引擎系统生态构建01
2025-10-16 10:08

flyair_China的博客效果广告优化师：在服务电商客户“优品服饰”时，为其“春季...一周后，系统自动将表现最好的创意组合的应用比例提升至100%，优化师将这一过程和结果（CTR提升25%）截图，通过企业微信发送给客户，作为服务价值的证明。
花落八股知多少
2025-05-29 20:29

洋小白的进阶之旅的博客聚簇索引和非聚簇索引什么是聚簇索引和非聚簇索引，如何理解回表、索引下推-腾讯云开发者社区-腾讯云 聚簇索引（主键索引）：按照主键字段构建，将表数据按照主键顺序存储在磁盘上，确保了行的物理存储顺序与主键...
51c大模型~合集155
2025-07-16 14:08

whaosoft-143的博客具体而言，研究团队利用加权融合的方式在解码前将来自视觉对齐层的知识与全局信息结合，从而优化模型输出，既保留了语义信息，又减少了幻觉的产生。对于新的测试图像，该阈值可以确保生成的2D关键点置信区间（一系列...
golang大厂面试2
2023-07-04 14:42

theo.wu的博客在Redis中，写入操作通常是异步的，即当客户端发送写入命令时，Redis会立即返回一个响应，而实际的数据写入到内存或磁盘中的操作将在后台进行。这种异步写入的机制使得Redis能够快速地响应客户端请求，而不需要等待...
Bookmarks
2018-08-15 08:58

gmHappy的博客脚本之家一看就明白的爬虫入门讲解：基础理论篇-CSDN.NET IE8中JSON.stringify方法对自动转换unicode字符的解决方案 - 杯酒红尘 - 博客园 Unicode编码转换 - 站长工具将网页内容导出word文档jQuery插件 JavaScript...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月18日

批量将腾讯云的OCR识别结果写入导出的表格

1条回答 默认 最新

问题事件

1条回答默认最新