python将图片转换成Excel，有啥办法能优化一下出来的效果？

python将图片转换成Excel，有啥办法能优化一下出来的效果？

这和原图差的也太多了吧！

import cv2
import pytesseract
from PIL import Image
import openpyxl
# 读取图像
image = cv2.imread('D:\\1.jpg')
# 使用OpenCV进行图像预处理（例如灰度化、二值化等）
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
threshold = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
# 保存预处理后的图像
cv2.imwrite('D:\\1_image.jpg', threshold)
# 使用pytesseract进行图像识别
data = pytesseract.image_to_string(Image.open('D:\\1_image.jpg'),lang='chi_sim')
# 创建Excel表格
workbook = openpyxl.Workbook()
sheet = workbook.active
# 将识别结果写入Excel表格
rows = data.split('\n')
for i, row in enumerate(rows):
    cells = row.split('\t')
    for j, cell in enumerate(cells):
        sheet.cell(row=i+1, column=j+1).value = cell
        print(cell)
workbook.save("D:\\24.5.9.xlsx")

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
码农阿豪@新空间新星创作者: 前端开发技术领域 2024-05-09 15:10
关注
让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言
回答：针对这个问题，我们可以考虑一下以下几个办法来优化转换结果：
对图片进行处理：在使用OpenCV进行图像预处理时，我们可以尝试使用更适合当前图片的处理方式来提高转换结果的准确率。例如，在这个问题给出的代码中，我们使用了灰度化和二值化处理图片，可能并不能很好的适应当前图片的特点。我们可以尝试使用模糊化、锐化、饱和度增强等处理方式来试图提高结果的质量。
调整识别语言：在使用pytesseract进行图像识别时，默认使用的语言是英文。对于中文的识别，我们需要手动指定中文语言包，否则会影响结果质量。在这个问题给出的代码中，我们使用了“chi_sim”语言包进行中文识别。如果转换结果不符合预期，还可以尝试使用“eng”等其他语言包进行识别。
调整Excel输出格式：在将识别结果写入Excel表格时，我们可以考虑调整表格的样式，例如增加边框、对齐等，使得表格更加美观。如下为优化后的代码样例：

import cv2 import pytesseract from PIL import Image import openpyxl # 读取图像 image = cv2.imread('D:\\1.jpg') # 使用OpenCV进行图像预处理（尝试使用不同的处理方式来增强识别准确性） gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) blur = cv2.GaussianBlur(gray, (3, 3), 0) # 模糊化处理 binary = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1] # 二值化处理 # 保存预处理后的图像 cv2.imwrite('D:\\1_image.jpg', binary) # 使用pytesseract进行图像识别（尝试调整识别语言包） data = pytesseract.image_to_string(Image.open('D:\\1_image.jpg'), lang='chi_sim') # 创建Excel表格 workbook = openpyxl.Workbook() sheet = workbook.active # 将识别结果写入Excel表格（尝试调整输出格式） rows = data.split('\n') for i, row in enumerate(rows): cells = row.split('\t') for j, cell in enumerate(cells): sheet.cell(row=i+1, column=j+1).value = cell sheet.cell(row=i+1, column=j+1).border = openpyxl.styles.Border(left=openpyxl.styles.Side(border_style='thin', color='000000'), right=openpyxl.styles.Side(border_style='thin', color='000000'), top=openpyxl.styles.Side(border_style='thin', color='000000'), bottom=openpyxl.styles.Side(border_style='thin', color='000000')) sheet.cell(row=i+1, column=j+1).alignment = openpyxl.styles.Alignment(horizontal='center', vertical='center') workbook.save("D:\\24.5.9.xlsx")

在这个样例中，我们使用了模糊化处理，边框增加和居中对齐等方式来优化转换结果的质量。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

python图片转Excel-python文字识别-图片文字识别-亲测可用
2024-05-23 13:38

李四勺的博客这次解决这个问题，前后花了4天时间（当然是上班间隙，让我一个问题连续弄4天我也顶...虽然就是一个简单的图片文字识别功能，手机上甚至都是自动识别，但是真正要将它适配到我们具体的工作场景时，就不是简单的事了。
高薪金领都用啥编程语言？SQL、Python领航，附排名！
2024-07-15 19:09

量化风云的博客关于Python，在工程技巧方面可以参考我的新书《Python高效编程实战指南》，算法方面可以多刷leetcode、kaggle的题，或者简街、千禧的puzzle专栏，我们的专栏也不时会有一些性能优化的技巧。但是，金融行业对C++和...
python怎么把excel单元格里面的文字提取出来_干货 | Excel如何花式秀操作？
2020-11-30 05:35

weixin_39634997的博客求职工作，Excel必不可少百度曾开价两万寻找精通Excel的数据人才Excel不熟练还可能被辞退...都知道Excel重要，如何快速提高？Excel不仅是制表工具你可能觉得Excel只是个普通不过的制表工具，但却是职场生存的基本...
python实现xmind_将xmind文件转成可编程数据类型
2020-11-29 16:17

weixin_39932455的博客免费版相对于Pro版能导出的文件种类少一些，但有时候你可能想我做的xmind能不能通过编程再加工一下，比如集成到某个网页，或者通过api和某某系统集成。那么xmindparser就是这么一个项目，了解一下。安装xmindparser...
简单的python代码编程图形,python有趣的图案代码
2023-02-02 10:23

aifans_bert的博客大家好，小编为大家解答简单的python代码编程图形的问题。很多人还不知道python代码画图案简单，现在让我们一起来看看吧！
8个建议，为啥不使用Python开发大型项目！
2022-04-18 08:38

菜鸟学Python的博客（点击上方快速关注并设置为星标，一起学Python）来源：CSDN整理 | 张仕影责编 | 郑丽媛在开发者的职业生涯中，有一个特定阶段，开发者们会从为项目做贡献到掌握自己的技巧。这个阶段对有些人来说会来得早一些，...
Python 为什么不设计 do-while 循环结构？
2022-04-16 17:38

菜鸟学Python的博客在某些编程语言中，例如 C/C++、C#、PHP、Java、JavaScript 等等，do-while 是一种基本的循环结构。它的核心语义是：先执行一遍循环体代码，然后执行一遍条件语句，若条件语句判断为真，则继续执行循环体代码，并...
②. GPT错误：图片尺寸写入excel权限错误
2023-10-11 13:08

赵灵越的博客在这段代码中，尝试将一个字典作为Excel表格单元格的值进行赋值，但是Excel表格只能接受基本数据类型的值。解决这个问题需要检查你的代码中是否存在访问受限的文件或目录，并将其修改为具有读写权限的目录。要解决这...
【2025B卷首发】华为OD机试真题+全流程解析+备考攻略+经验分享+python/JavaScript/C/C++多种语言最佳实现
2025-06-20 07:54

哪吒的博客 4、编码工具删除行 ctrl+d依旧可以使用，ctrl+c，+v ，+z 等均可正常使用，其他快捷键建议尽量莫用，尤其是有保存习惯的同学，不要用ctrl+s，否则会打开页面保存键，算弹出当前页面一次。很多考过的小伙伴，总结了...
全中国一共有多少IP地址？Python来告诉你！
2021-12-11 10:59

菜鸟学Python的博客有兴趣玩一些趣味的Python程序，并且想玩服务器编程的可以加入我们，我们一年会带大家玩7个项目，大家可以修改我们的代码来扩展它的功能，比如监控股票的可以改成监控基金的，或者是多个金融数据产品，然后根据一些...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月9日

python将图片转换成Excel，有啥办法能优化一下出来的效果？

4条回答 默认 最新

问题事件

4条回答默认最新