湖北二师的咸鱼 2020-05-29 23:44 采纳率: 0%

这里面有的不懂就是 sklearns中怎么predict 和fit 的数据格式不同啊，怎么还可以运行，难道sklearn没必要输入节点相同

from keras import activations
from keras import backend as K
from keras.engine.topology import Layer

def squash(x, axis=-1):
s_squared_norm = K.sum(K.square(x), axis, keepdims=True) + K.epsilon()
scale = K.sqrt(s_squared_norm) / (0.5 + s_squared_norm) #疑问：论文中是加上1，这里是加上了0.5 并且此种变化是分子分母进行了约分
return scale * x

define our own softmax function instead of K.softmax

def softmax(x, axis=-1):
ex = K.exp(x - K.max(x, axis=axis, keepdims=True))
return ex / K.sum(ex, axis=axis, keepdims=True) #疑问：这个将softmax改了 e(x-max(x))/sum( e(x-max)) max可以被任何东西换掉

A Capsule Implement with Pure Keras

class Capsule(Layer):
def init(self, num_capsule, dim_capsule, routings=3, share_weights=True, activation='squash', kwargs):
# Capsule(10, 16, 3, True)(cnn) # [64,128]
super(Capsule, self).__init__(kwargs)
self.num_capsule = num_capsule #胶囊数目 10
self.dim_capsule = dim_capsule #每个胶囊的维度 16
self.routings = routings #动态路由次数
self.share_weights = share_weights #是否共享变量参数
if activation == 'squash':
self.activation = squash
else:
self.activation = activations.get(activation)

def build(self, input_shape):
    super(Capsule, self).build(input_shape)

    input_dim_capsule = input_shape[-1]
    if self.share_weights:#共享权重
        self.W = self.add_weight(name='capsule_kernel',
                                 shape=(1,#共享就将胶囊个数赋值为1
                                        input_dim_capsule,
                                        self.num_capsule * self.dim_capsule), #10,16
                                 initializer='glorot_uniform',
                                 trainable=True)
    else:
        input_num_capsule = input_shape[-2]
        self.W = self.add_weight(name='capsule_kernel',
                                 shape=(input_num_capsule,
                                        input_dim_capsule,  #
                                        self.num_capsule * self.dim_capsule),
                                 initializer='glorot_uniform',
                                 trainable=True)

def call(self, u_vecs): #[64,128]
    if self.share_weights:
        u_hat_vecs = K.conv1d(u_vecs, self.W)  # [1,128,160]
    else:
        u_hat_vecs = K.local_conv1d(u_vecs, self.W, [1], [1])

    batch_size = K.shape(u_vecs)[0]
    input_num_capsule = K.shape(u_vecs)[1]
    u_hat_vecs = K.reshape(u_hat_vecs, (batch_size, input_num_capsule,
                                        self.num_capsule, self.dim_capsule))
    u_hat_vecs = K.permute_dimensions(u_hat_vecs, (0, 2, 1, 3))
    # final u_hat_vecs.shape = [None, num_capsule, input_num_capsule, dim_capsule]

    b = K.zeros_like(u_hat_vecs[:, :, :, 0])  # shape = [None, num_capsule, input_num_capsule]
    for i in range(self.routings):
        c = softmax(b, 1)
        o = K.batch_dot(c, u_hat_vecs, [2, 2])
        if K.backend() == 'theano':
            o = K.sum(o, axis=1)
        if i < self.routings - 1:
            o = K.l2_normalize(o, -1)
            b = K.batch_dot(o, u_hat_vecs, [2, 3])
            if K.backend() == 'theano':
                b = K.sum(b, axis=1)

    return self.activation(o)

def compute_output_shape(self, input_shape):
    return (None, self.num_capsule, self.dim_capsule)

搭建网络，通过对比普通的CNN模型及Capsule+CNN对比

#************************************************************************************

! -- coding: utf-8 --

from Capsule_Keras import *

from keras import utils
from keras.datasets import mnist
from keras.models import Model
from keras.layers import *
from keras import backend as K

准备训练数据

batch_size = 128
num_classes = 10
img_rows, img_cols = 28, 28

加载数据集

(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1)
x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1)
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
x_train /= 255
x_test /= 255

换one hot格式

y_train = utils.to_categorical(y_train, num_classes)
y_test = utils.to_categorical(y_test, num_classes)

准备自定义的测试样本

对测试集重新排序并拼接到原来测试集，就构成了新的测试集，每张图片有两个不同数字

idx = list(range(len(x_test)) ) #list(range(10))

打乱顺序

np.random.shuffle(idx)

传入的数组必须具有相同的形状，这里的相同的形状可以满足在拼接方向axis轴上数组间的形状一致即可

X_test = np.concatenate([x_test, x_test[idx]], 1) #(x_train.shape[0], img_rows, img_cols, 1)==》[x_train.shape[0], 2*img_rows, img_cols, 1]

np.vstack:按垂直方向（行顺序）堆叠数组构成一个新的数组

Y_test = np.vstack([y_test.argmax(axis=1), y_test[idx].argmax(axis=1)]).T#Y_test.shape===>[none,2]
X_test = X_test[Y_test[:, 0] != Y_test[:, 1]] # 确保两个数字不一样
Y_test = Y_test[Y_test[:, 0] != Y_test[:, 1]]
Y_test.sort(axis=1) # 排一下序，因为只比较集合，不比较顺序

搭建普通CNN分类模型

input_image = Input(shape=(None, None, 1))
cnn = Conv2D(64, (3, 3), activation='relu')(input_image)
cnn = Conv2D(64, (3, 3), activation='relu')(cnn)
cnn = AveragePooling2D((2, 2))(cnn)
cnn = Conv2D(128, (3, 3), activation='relu')(cnn)
cnn = Conv2D(128, (3, 3), activation='relu')(cnn)
cnn = GlobalAveragePooling2D()(cnn) #(batch_size, rows, cols, channels)==》(batch_size, channels)
dense = Dense(128, activation='relu')(cnn)
output = Dense(10, activation='sigmoid')(dense)

model = Model(inputs=input_image, outputs=output)
model.compile(
#这里就是运行了论文中的losss表达方式
loss=lambda y_true, y_pred: y_true * K.relu(0.9 - y_pred) ** 2 + 0.25 * (1 - y_true) * K.relu(
y_pred - 0.1) ** 2,#y_true是one-one编码 y_pred就是经过sigmoid的output

optimizer='adam',
metrics=['accuracy'])

model.summary()

model.fit(x_train, y_train,
batch_size=batch_size,
epochs=20,
verbose=1,
validation_data=(x_test, y_test))

Y_pred = model.predict(X_test) # 用模型进行预测 X_test.shape=[x_train.shape[0], 2*img_rows, img_cols, 1] Y_pred[x_train.shape[0],num_classes]
#Y_pred.shape=(none, num_classes)
greater = np.sort(Y_pred, axis=1)[:, -2] > 0.5 # 判断预测结果是否大于0.5 返回值是[true,false,true....] 疑问：这个作用是啥，置信度？
#greater 由于是从低到高排序，并且两个正确并且大于0.5才算过，所以取倒数第二个看是否大于0.5即可
Y_pred = Y_pred.argsort()[:, -2:] # 取最高分数的两个类别 argsort 默认从小到大排序的索引 Y_pred[x_train.shape[0],2]
Y_pred.sort(axis=1) # 排序，因为只比较集合 Y_pred[x_train.shape[0],2]

acc = 1. * (np.prod(Y_pred == Y_test, axis=1)).sum() / len(X_test) #np.prod 返回给定轴上的数组元素的乘积。
print(u'CNN+Pooling，不考虑置信度的准确率为：%s' % acc)
acc = 1. * (np.prod(Y_pred == Y_test, axis=1) * greater).sum() / len(X_test)
print(u'CNN+Pooling，考虑置信度的准确率为：%s' % acc)

搭建CNN+Capsule分类模型

一个常规的 Conv2D 模型

input_image = Input(shape=(None, None, 1)) #[28,28,1]
cnn = Conv2D(64, (3, 3), activation='relu')(input_image) #[(28-3+1)/1=26,26,64]
cnn = Conv2D(64, (3, 3), activation='relu')(cnn) #[(26-3+1)/1=[24,24,64]
cnn = AveragePooling2D((2, 2))(cnn) #平均池化 #[12,12,1]
cnn = Conv2D(128, (3, 3), activation='relu')(cnn) #[(12-3+1)/1=[10,10,128]
cnn = Conv2D(128, (3, 3), activation='relu')(cnn) #[(10-3+1)/1=[8,8,128]

cnn = Reshape((-1, 128))(cnn) #[64,128]
capsule = Capsule(10, 16, 3, True)(cnn) #[64,128]

return (None, self.num_capsule, self.dim_capsule)

output = Lambda(lambda x: K.sqrt(K.sum(K.square(x), 2)), output_shape=(10,))(capsule)

model = Model(inputs=input_image, outputs=output)
model.compile(loss=lambda y_true, y_pred: y_true * K.relu(0.9 - y_pred) ** 2 + 0.25 * (1 - y_true) * K.relu(
y_pred - 0.1) ** 2,
optimizer='adam',
metrics=['accuracy'])

model.summary()

model.fit(x_train, y_train, #x_train.shape=[总数目, img_rows, img_cols, 1]
batch_size=batch_size,
epochs=20,
verbose=1,
validation_data=(x_test, y_test))

Y_pred = model.predict(X_test) # 用模型进行预测
greater = np.sort(Y_pred, axis=1)[:, -2] > 0.5 # 判断预测结果是否大于0.5
Y_pred = Y_pred.argsort()[:, -2:] # 取最高分数的两个类别
Y_pred.sort(axis=1) # 排序，因为只比较集合

acc = 1. * (np.prod(Y_pred == Y_test, axis=1)).sum() / len(X_test)
print(u'CNN+Capsule，不考虑置信度的准确率为：%s' % acc)
acc = 1. * (np.prod(Y_pred == Y_test, axis=1) * greater).sum() / len(X_test)
print(u'CNN+Capsule，考虑置信度的准确率为：%s' % acc)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
zqbnqsdsmd 2020-09-13 23:02
关注
https://www.jb51.net/article/189593.htm

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python调用sklearn中SGDRegressor和LinearRegression，报错显示不可调用 python 有问必答
2022-02-22 17:16

回答 3 已采纳建一个回归器对象： estimator1 = LinearRegression()报错是第34行y1_predict = estimator1(x_test)错误，缺少了对象的方法写成如下调用pred
Python，在分析建模的过程中出现报错显示，找到样本数不一致的输入变量，有人能解释一下并解决这个问题吗？ python
2022-05-31 20:42

回答 1 已采纳哪一行报错，有截图吗
机器学习决策树鸢尾花数据集，绘制决策边界，出现相同代码相同数据多次运行，结果不一致的问题 python 决策树机器学习
2022-02-03 21:18

回答 1 已采纳 sklearn.tree.DecisionTreeClassifier()在进行分支的时候特征选择是随机的，即使是splitter=”best”的时候。打印dt_clf.feature_importa
sklearn的 fit 和 predict 使用
2022-08-10 09:32

BigDeng_2014的博客 sklearn的 fit 和 predict 使用
找不到sklearn组件报错，如何解决？ python sklearn
2022-12-08 10:29

回答 1 已采纳 sklearn包的全称是scikit-learn。所以你应该是pip install scikit-learn
model.preditc输出和输入形状不一致 python
2022-04-14 15:41

回答 1 已采纳肯定不是一样啊，输入是你数据的维度，输出是你需要干的事的维度，比如分类模型，分10类，输出就是10维
如何对在该sklearn代码中添加mae模型评估 python sklearn 机器学习
2021-10-04 14:55

回答 1 已采纳随机森林，可以通过score来进行判断精度。
python中fit用法_Python sklearn中的.fit与.predict的用法说明
2020-12-20 22:53

weixin_39890327的博客我就废话不多说了，大家还是直接看代码吧~clf=KMeans(n_clusters=5) #创建分类器对象fit_clf=clf.fit(X) #用训练器数据拟合分类器模型clf.predict(X) #也可以给新数据数据对其预测print(clf.cluster_centers_) #输出...
为什么LogisticRegression.fit输入2D数据无法强转1D python 有问必答机器学习
2021-06-21 20:51

回答 3 已采纳在新版的sklearn中，所有的数据都应该是二维矩阵，哪怕它只是单独一行或一列（比如前面做预测时，仅仅只用了一个样本数据），所以需要使用.reshape(1,-1)进行转换具体可以参考：使用skl
keras模型训练输出和测试输出数据维度不一致 keras python 神经网络
2023-02-23 17:17

回答 2 已采纳试下这样：predict2 = model.predict(Xtrain)print(predict2.shape)看下是否训练数据也一样
Brich无法从sklearn.cluster中导入 python 有问必答
2022-04-05 18:17

回答 3 已采纳模块名写错了，应该是Birch，将代码中Brich全部改成的Birch。参考用法:https://scikit-learn.org.cn/view/375.html
python中的predict_关于Python sklearn中的.fit与.predict的用法
2021-02-03 11:44

易课说运营的博客关于Python sklearn中的.fit与.predict的用法发布时间：2020-06-28 17:57:38来源：亿速云阅读：229作者：清晨这篇文章主要介绍关于Python sklearn中的.fit与.predict的用法，文中示例代码介绍的非常详细，具有一定的...
python中matplotlib绘图时，画布为正方形，但是里面的图不是正方形，该怎么设置 python
2022-03-13 22:37

回答 1 已采纳你这个是整个画布的尺寸 fig = plt.figure(figsize=(15,15)) # 指定图像的宽和高然后把画布分成了3行1列，在其中第2个子画布上作的图，自然长宽不一致（3：1） a
python中fit是什么意思_Python sklearn中的.fit与.predict的用法代码解析
2020-12-09 03:06

weixin_39608559的博客本篇文章小编给大家分享一下Python sklearn中的.fit与.predict的用法代码解析，代码介绍的很详细，小编觉得挺不错的，现在分享给大家供大家参考，有需要的小伙伴们可以来看看。代码如下clf=KMeans(n_clusters=5) #...
sklearn基础篇（三）-- 鸢尾花(iris)数据集分析和分类
2022-10-28 08:00

长路漫漫2021的博客本文是基于《Python机器学习基础教程》第一章学习的总结，主要是基于iris数据集进行探索数据分析和不同分类模型的对比，从而熟悉使用sklearn的模型进行机器学习。
python中predict函数和score函数的区别_sklearn库中.score（）和.predict之间的区别？
2020-12-10 10:32

weixin_40001309的博客我使用sklearn库实例化了一个SVC对象，代码如下：clf = svm.SVC(kernel='linear', C=1, cache_size=1000, max_iter = -1, verbose = True)然后我使用以下方法为数据拟合：model = clf.fit(X_train, y_train)其中X_...
【已解决】sklearn svm的predict和proba输出结果不一样的原因
2022-03-26 22:29

Shawn向陽的博客查阅sklearn官方文档可知，predict_log_proba(X)这个函数计算X中的样本可能结果的概率。但是该概率的计算使用交叉验证创建概率模型，因此结果可以略有不同于预测获得的模型。此外，它将在非常小的数据集上产生毫无...
sklearn 中 predict 方法和 predict_proba 方法的区别和使用
2021-05-05 10:11

小瓶盖的猪猪侠的博客 predict 和 predict_proba的概念 1、predict和predict_proba都是用于模型的预测。 2、predict返回的是一个预测的值，predict_proba返回的是对于预测为各个类别的概率。 3、predict_proba返回的是一个 n 行 k 列的...
[Bug记录] sklearn中predict与predict_proba的识别结果不一致
2019-03-20 19:05

小刀丶的博客今天训练了好久的决策树模型...经过胡乱分析发现predict_proba得到的维度比总类别数少了几个，经过测试发现就是这个造成的，即训练集中有部分类别样本数为0。这个问题比较隐蔽，记录一下方便天涯沦落人绕坑。 Tip：...
没有解决我的问题, 去提问

悬赏问题

¥15 cgictest.cgi文件无法访问
¥20 删除和修改功能无法调用
¥15 kafka topic 所有分副本数修改
¥15 小程序中fit格式等运动数据文件怎样实现可视化？（包含心率信息））
¥15 如何利用mmdetection3d中的get_flops.py文件计算fcos3d方法的flops？
¥40 串口调试助手打开串口后,keil5的代码就停止了
¥15 电脑最近经常蓝屏，求大家看看哪的问题
¥60 高价有偿求java辅导。工程量较大，价格你定，联系确定辅导后将采纳你的答案。希望能给出完整详细代码，并能解释回答我关于代码的疑问疑问，代码要求如下，联系我会发文档
¥50 C++五子棋AI程序编写
¥30 求安卓设备利用一个typeC接口，同时实现向pc一边投屏一边上传数据的解决方案。

这里面有的不懂就是 sklearns中 怎么predict 和fit 的数据格式不同啊，怎么还可以运行，难道sklearn没必要输入节点相同