openCV_python自带的ANN进行手写字体识别，报错。求助

图片说明

我用python3.6按照《OpenCV3计算机视觉》书上代码进行手写字识别，识别率很低，运行时还报了错:OpenCV(3.4.1) Error: Assertion failed ((type == 5 || type == 6) && inputs.cols == layer_sizes[0]) in cv::ml::ANN_MLPImpl::predict, file C:\projects\opencv-python\opencv\modules\ml\src\ann_mlp.cpp, line 411

具体代码如下：求大佬指点下
import cv2
import numpy as np
import digits_ann as ANN


def inside(r1, r2):
  x1, y1, w1, h1 = r1
  x2, y2, w2, h2 = r2
  if (x1 > x2) and (y1 > y2) and (x1 + w1 < x2 + w2) and (y1 + h1 < y2 + h2):
    return True
  else:
    return False
def wrap_digit(rect):
  x, y, w, h = rect
  padding = 5
  hcenter = x + w / 2
  vcenter = y + h / 2
  if (h > w):
    w = h
    x = hcenter - (w / 2)
  else:
    h = w
    y = vcenter - (h / 2)
  return (int(x - padding), int(y - padding), int(w + padding), int(h + padding))


'''
注意：首次测试时，建议将使用完整的训练数据集，且进行多次迭代，直到收敛
如：ann, test_data = ANN.train(ANN.create_ANN(100), 50000, 30)
'''
ann, test_data = ANN.train(ANN.create_ANN(10), 50000, 1)

# 调用所需识别的图片，并处理
path = "C:\\Users\\64601\\PycharmProjects\Ann\\images\\numbers.jpg"
img = cv2.imread(path, cv2.IMREAD_UNCHANGED)
bw = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
bw = cv2.GaussianBlur(bw, (7, 7), 0)
ret, thbw = cv2.threshold(bw, 127, 255, cv2.THRESH_BINARY_INV)
thbw = cv2.erode(thbw, np.ones((2, 2), np.uint8), iterations=2)
image, cntrs, hier = cv2.findContours(thbw.copy(), cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

rectangles = []

for c in cntrs:
  r = x, y, w, h = cv2.boundingRect(c)
  a = cv2.contourArea(c)
  b = (img.shape[0] - 3) * (img.shape[1] - 3)

  is_inside = False
  for q in rectangles:
    if inside(r, q):
      is_inside = True
      break
  if not is_inside:
    if not a == b:
      rectangles.append(r)

for r in rectangles:
  x, y, w, h = wrap_digit(r)
  cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2)
  roi = thbw[y:y + h, x:x + w]

  try:
    digit_class = ANN.predict(ann, roi)[0]
  except:
    print("except")
    continue
  cv2.putText(img, "%d" % digit_class, (x, y - 1), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0))

cv2.imshow("thbw", thbw)
cv2.imshow("contours", img)
cv2.waitKey()
cv2.destroyAllWindows()
#######
import cv2
import pickle
import numpy as np
import gzip

"""OpenCV ANN Handwritten digit recognition example

Wraps OpenCV's own ANN by automating the loading of data and supplying default paramters,
such as 20 hidden layers, 10000 samples and 1 training epoch.

The load data code is taken from http://neuralnetworksanddeeplearning.com/chap1.html
by Michael Nielsen
"""


def vectorized_result(j):
  e = np.zeros((10, 1))
  e[j] = 1.0
  return e


def load_data():
  with gzip.open('C:\\Users\\64601\\PycharmProjects\\Ann\\mnist.pkl.gz') as fp:
    # 注意版本不同，需要添加传入第二个参数encoding='bytes'，否则出现编码错误
    training_data, valid_data, test_data = pickle.load(fp, encoding='bytes')
    fp.close()
  return (training_data, valid_data, test_data)


def wrap_data():
  # tr_d数组长度为50000，va_d数组长度为10000，te_d数组长度为10000
  tr_d, va_d, te_d = load_data()

  # 训练数据集
  training_inputs = [np.reshape(x, (784, 1)) for x in tr_d[0]]
  training_results = [vectorized_result(y) for y in tr_d[1]]
  training_data = list(zip(training_inputs, training_results))

  # 校验数据集
  validation_inputs = [np.reshape(x, (784, 1)) for x in va_d[0]]
  validation_data = list(zip(validation_inputs, va_d[1]))

  # 测试数据集
  test_inputs = [np.reshape(x, (784, 1)) for x in te_d[0]]
  test_data = list(zip(test_inputs, te_d[1]))
  return (training_data, validation_data, test_data)


def create_ANN(hidden=20):
  ann = cv2.ml.ANN_MLP_create()  # 建立模型
  ann.setTrainMethod(cv2.ml.ANN_MLP_RPROP | cv2.ml.ANN_MLP_UPDATE_WEIGHTS)  # 设置训练方式为反向传播
  ann.setActivationFunction(
    cv2.ml.ANN_MLP_SIGMOID_SYM)  # 设置激活函数为SIGMOID，还有cv2.ml.ANN_MLP_IDENTITY,cv2.ml.ANNMLP_GAUSSIAN
  ann.setLayerSizes(np.array([784, hidden, 10]))  # 设置层数，输入784层，输出层10
  ann.setTermCriteria((cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 100, 0.1))  # 设置终止条件
  return ann


def train(ann, samples=10000, epochs=1):
  # tr:训练数据集; val:校验数据集; test:测试数据集;
  tr, val, test = wrap_data()

  for x in range(epochs):
    counter = 0
    for img in tr:
      if (counter > samples):
        break
      if (counter % 1000 == 0):
        print("Epoch %d: Trained %d/%d" % (x, counter, samples))
      counter += 1
      data, digit = img
      ann.train(np.array([data.ravel()], dtype=np.float32), cv2.ml.ROW_SAMPLE,
                np.array([digit.ravel()], dtype=np.float32))
    print("Epoch %d complete" % x)
  return ann, test


def predict(ann, sample):
  resized = sample.copy()
  rows, cols = resized.shape
  if rows != 28 and cols != 28 and rows * cols > 0:
    resized = cv2.resize(resized, (28, 28), interpolation=cv2.INTER_CUBIC)
  return ann.predict(np.array([resized.ravel()], dtype=np.float32))

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Tiger-Li 2020-10-08 17:01
关注
图片识别算法有问题

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

opencv-python>=4.1.2 not found 报错处理 opencv python 图像处理
2022-11-06 21:48

回答 7 已采纳你确定你运行的环境是这个（图里的红框）吗？
opencv python 截取图像部分区域保存报错215 opencv python 有问必答
2022-01-06 09:58

回答 1 已采纳你输出img_cut看看数据格式，错误提示img.empty，应该是你变量img_cut不是一个图片数据
Python opencv进行相机标定报错 opencv python 有问必答视觉检测
2022-05-25 11:25

回答 2 已采纳这种一般是参数不对或者参数为空，检查一下这个函数里面的各个参数是否正确
opencv(python)使用ann神经网络识别手写数字
2020-12-25 17:52

Keras深度学习的博客 opencv中也提供了一种类似于Keras的神经网络，即为ann，这种神经网络的使用方法与Keras的很接近。关于mnist数据的解析，读者可以自己从网上下载相应压缩文件，用python自己编写解析代码，由于这里主要研究knn算法，...
电脑同时安装opencv 与opencv-python，他们会相互影响.不正常运行吗？ opencv python 计算机视觉
2022-02-18 21:58

回答 2 已采纳可以，互不影响OpenCV-python 只是 python 的一个第三方包，不能脱离python 环境和python 程序来使用的。
OpenCV的detectMultiScale报错，如何解决？(语言-python) opencv python
2023-02-08 10:19

回答 3 已采纳根据你的报错信息，我可以明确的告诉你就是由于opencv不支持中文路径的读写你这face的路径这么写的话，绝对路径里面就是有中文，图片读取失败了导致后面的问题。另外，学编程的第一步就是不要用中文路
opencv- python自带的人脸识别lbph算法是否用到了卷积神经网络？ python 有问必答
2022-02-28 23:22

回答 2 已采纳没有用到卷积神经网络，照片数量感觉和准确率应该关系不大，lbph算法本身是通过比较不同人脸图像LBP编码直方图达到人脸识别的目的
python数字识别库_OpenCV3-Python下ANN进行MNIST数字识别
2020-12-18 02:36

weixin_39627361的博客 1. MNIST数据库MNIST数据库是Web上非常流行的OCR和手写字符识别分类器的训练资源。下载mnist.pkl.gz数据集，并将其放置到与.py文件同级目录下。2. 初始化参数(1)输入层由于采用MNIST数据库，它里面的每幅图像大小为...
python + opencv人脸识别然后进行比对如何实现？ opencv python
2017-09-29 09:19

回答 1 已采纳 http://mp.weixin.qq.com/s/DYCXef_09yFFNR0uHL2Q0Q python 一个接口你可以研究一下
cmake编译opencv到all_build这一步一直循环报错 opencv
2022-04-10 21:41

回答 3 已采纳少regsvr32 某个dll
OpenCV报错 You can enable it via 'OPENCV_IO_ENABLE_OPENEXR' c++ opencv
2023-02-03 20:37

回答 8 已采纳因為目前OpenCV默认不支持OpenEXR图像格式，因此必须在编译OpenCV时打开对OpenEXR的支持。妳可以在编译OpenCV时启用'OPENCV_IO_ENABLE_OPENEXR'宏定义。
python+OpenCV笔记（三十八）：识别手写数字——基于人工神经网络ANN
2022-02-11 14:22

ReadyGo!!!的博客 python+OpenCV笔记（三十八）：识别手写数字——基于人工神经网络ANN
openCV人脸识别报错 opencv qt
2023-03-16 18:10

回答 4 已采纳 1，因为你load函数用错了，opencv对这个load函数的参数要求是const string或FileStorage类型，而你给的是const char * ，类型不匹配自然报错。2，predic
python ANN人工神经网络手写字图像识别（成功运行）
2022-01-05 16:00

Vertira的博客 opencv中也提供了一种类似于Keras的神经网络，即为ann，这种神经网络的使用方法与Keras的很接近。关于mnist数据的解析，读者可以自己从网上下载相应压缩文件，用python自己编写解析代码，由于这里主要研究knn算法，...
svm python实现手写字_Python opencv实现的手写字符串识别(SVM 神经网络 K近邻 Boosting......
2020-12-29 04:33

weixin_39992831的博客 Python2.7+opencv2.4+numpyopencv2.4只要将\opencv\build\pythonn2.7\cv2.pyd复制到\Python27\Lib\site-packages中就可以了手写字符集在这里http://yann.lecun.com/exdb/mnist/60k个train，10k个test，28*28大小。...
没有解决我的问题, 去提问

悬赏问题

¥15 对于相关问题的求解与代码
¥15 ubuntu子系统密码忘记
¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
¥15 保护模式-系统加载-段寄存器
¥15 电脑桌面设定一个区域禁止鼠标操作
¥15 求NPF226060磁芯的详细资料
¥15 使用R语言marginaleffects包进行边际效应图绘制
¥20 usb设备兼容性问题
¥15 错误(10048): “调用exui内部功能”库命令的参数“参数4”不能接受空数据。怎么解决啊
¥15 安装svn网络有问题怎么办

openCV_python自带的ANN进行手写字体识别，报错。求助

2条回答 默认 最新

悬赏问题

2条回答默认最新