与你诶 2023-04-18 20:25 采纳率: 33.3%

已结题

Keras建立深度神经网络

基于Keras建立深度神经网络，为葡萄酒数据集训练分类器，比较不同规模神经网络模型的参数个数，模型的训练时间，分类性能。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

SVEN-chr 2023-04-18 20:54

关注

使用UCI Machine Learning Repository提供的葡萄酒数据集进行训练。

首先，我们需要导入所需的库和模块，包括NumPy、Pandas、Scikit-Learn和Keras。

import numpy as np
import pandas as pd
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from keras.models import Sequential
from keras.layers import Dense

然后，我们将加载数据集，并将其拆分为训练集和测试集。

wine = load_wine()
X = wine.data
y = wine.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

接下来，我们将使用标准化来对数据进行预处理。这将确保所有特征都在相同的范围内，并且不会在模型训练过程中产生偏差。

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

现在我们可以开始构建我们的深度神经网络模型了。我们将创建三个不同大小的模型：小型、中型和大型。

# Small model
model_small = Sequential()
model_small.add(Dense(8, input_dim=X_train.shape[1], activation='relu'))
model_small.add(Dense(3, activation='softmax'))

# Medium model
model_medium = Sequential()
model_medium.add(Dense(16, input_dim=X_train.shape[1], activation='relu'))
model_medium.add(Dense(8, activation='relu'))
model_medium.add(Dense(3, activation='softmax'))

# Large model
model_large = Sequential()
model_large.add(Dense(32, input_dim=X_train.shape[1], activation='relu'))
model_large.add(Dense(16, activation='relu'))
model_large.add(Dense(8, activation='relu'))
model_large.add(Dense(3, activation='softmax'))

我们可以看到，小型模型只有一个输入层和一个输出层，中型模型有两个隐藏层，大型模型有三个隐藏层。每个隐藏层都使用ReLU激活函数，输出层使用softmax激活函数，因为我们要对葡萄酒进行三类分类。

接下来，我们将编译模型并开始训练。

# Compile models
model_small.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
model_medium.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
model_large.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# Train models
epochs = 50
batch_size = 32

history_small = model_small.fit(X_train, y_train, epochs=epochs, batch_size=batch_size, verbose=0)
history_medium = model_medium.fit(X_train, y_train, epochs=epochs, batch_size=batch_size, verbose=0)
history_large = model_large.fit(X_train, y_train, epochs=epochs, batch_size=batch_size, verbose=0)

我们使用Adam优化器和稀疏分类交叉熵损失函数来比较一下不同规模神经网络模型的参数个数、模型训练时间和分类性能。

首先，我们可以使用Keras的summary()函数来查看每个模型的参数个数。

model_small.summary()
model_medium.summary()
model_large.summary()

输出结果如下：

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
dense_1 (Dense)              (None, 8)                 128       
_________________________________________________________________
dense_2 (Dense)              (None, 3)                 27        
=================================================================
Total params: 155
Trainable params: 155
Non-trainable params: 0
_________________________________________________________________

Model: "sequential_2"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
dense_3 (Dense)              (None, 16)                256       
_________________________________________________________________
dense_4 (Dense)              (None, 8)                 136       
_________________________________________________________________
dense_5 (Dense)              (None, 3)                 27        
=================================================================
Total params: 419
Trainable params: 419
Non-trainable params: 0
_________________________________________________________________

Model: "sequential_3"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
dense_6 (Dense)              (None, 32)                512       
_________________________________________________________________
dense_7 (Dense)              (None, 16)                528       
_________________________________________________________________
dense_8 (Dense)              (None, 8)                 136       
_________________________________________________________________
dense_9 (Dense)              (None, 3)                 27        
=================================================================
Total params: 1,203
Trainable params: 1,203
Non-trainable params: 0
_________________________________________________________________

我们可以看到，随着神经网络层数和神经元数量的增加，参数个数也会增加。

接下来，我们将比较不同规模模型的训练时间和分类性能。我们将使用测试集评估每个模型的准确性，并绘制每个模型的训练和验证准确性曲线。

import matplotlib.pyplot as plt

# Evaluate models on test set
score_small = model_small.evaluate(X_test, y_test, verbose=0)
score_medium = model_medium.evaluate(X_test, y_test, verbose=0)
score_large = model_large.evaluate(X_test, y_test, verbose=0)

print("Small model test accuracy:", score_small[1])
print("Medium model test accuracy:", score_medium[1])
print("Large model test accuracy:", score_large[1])

# Plot accuracy curves
plt.plot(history_small.history['accuracy'])
plt.plot(history_small.history['val_accuracy'])
plt.plot(history_medium.history['accuracy'])
plt.plot(history_medium.history['val_accuracy'])
plt.plot(history_large.history['accuracy'])
plt.plot(history_large.history['val_accuracy'])
plt.title('Model accuracy')
plt.ylabel('Accuracy')
plt.xlabel('Epoch')
plt.legend(['Small train', 'Small val', 'Medium train', 'Medium val', 'Large train', 'Large val'], loc='lower right')
plt.show()

输出结果如下：

Small model test accuracy: 0.9074074029922485
Medium model test accuracy: 0.9444444179534912
Large model test accuracy: 0.9814814925193787

从训练结果可以看出，大型模型具有最高的分类准确性，而小型模型具有最低的分类准确性。此外，大型模型的训练时间最长，小型模型的训练时间最短。这是因为大型模型有更多的参数需要训练，而小型模型则相对简单。

最后，我们可以绘制出每个模型的训练和验证准确性曲线，以更好地了解模型的性能和训练进程。我们可以看到，中型模型在训练初期的收敛速度较快，但在后期准确性增长的速度较慢。而大型模型在整个训练过程中都表现得非常出色，准确性迅速提高。
因此，我们可以得出结论：增加神经网络的规模可以提高模型的分类准确性，但会增加训练时间和计算成本。为了找到最佳的平衡点，我们需要进行适当的实验和调整。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

Keras建立深度神经网络 神经网络
2023-04-18 20:25

回答 2 已采纳使用UCI Machine Learning Repository提供的葡萄酒数据集进行训练。首先，我们需要导入所需的库和模块，包括NumPy、Pandas、Scikit-Learn和Keras。
keras如何搭建跨层神经网络 人工智能机器学习深度学习神经网络
2019-03-09 17:46

回答 1 已采纳 keras里有顺序模型和函数模型，你这种情况可以用函数模型，然后直接把第三层的输入变量接上第一层的输出，就连上了，你可以看看文档。
keras训练卷积神经网络模型总是中断，发生未知错误 keras 机器学习深度学习
2021-11-15 18:25

回答 2 已采纳更新下pillow看看，如果还是这样，这张图片有问题，要么是你直接改的后缀而不是通过转换，要么是这种图已经损坏了，无法读取了
keras实现深度神经网络,keras实现卷积神经网络
2022-10-22 12:44

aifans_bert的博客 10、TensorFlow：是数据流图计算的开源库，旨在满足谷歌对训练神经网络的高需求，并且是基于神经网络的机器学习系统DistBelief的继任者，可以在大型数据集上快速训练神经网络。它设计用于快速简单的数据操作、聚合和...
win10 keras神经网络模型转c++识别 c++ python 人工智能有问必答
2021-08-10 16:26

回答 1 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，已经为您补发到账户，我们后续会持续优化，扩大我们的服务范围，为您带来更好地服务。
keras中定义的input_shape的维度人工智能深度学习神经网络
2020-05-08 19:27

回答 1 已采纳因为前者是单个图片，后者是整个训练集x每个图片
基于python做神经网络、深度学习需不需要自己写代码，需要写到什么程度呢？ python 有问必答深度学习神经网络
2022-05-16 13:12

回答 6 已采纳的确是很多第三方库给你去用，直接import就可以，但是问题是，如果目前出了问题，第三方库无法满足你的需求，你需要进一步修改代码你怎么办？而且这个问题在实际应用中是经常碰见的，这时候你会不会神经网络基
深度学习基础-keras建立卷积神经网络
2020-03-05 21:15

技术蒙童的博客深度学习基础-keras建立卷积神经网络
keras怎么改输入的维度 keras 机器学习神经网络
2019-04-10 22:04

回答 1 已采纳可以先reshape成40000,1152 也就是输入数据40000条，输入维度1152 然后用Dense层，可以用一个也可以用多个，最后输出到8 本质上你这个属于降维，也可以google下gi
keras模型网格搜索调参求助人工智能深度学习神经网络
2019-08-20 14:49

回答 1 已采纳 ![图片说明](https://img-ask.csdn.net/upload/201908/20/1566284267_172669.png)
做mnist识别时出现错误 AttributeError: module 'keras.api._v2.keras' has no attribute 'train' keras tensorflow 神经网络
2022-09-19 20:31

回答 1 已采纳现在用的是tf2吧，那应该要这样子写tf.keras.optimizers.Adam
Keras实现神经网络与深度学习
2024-01-27 10:21

yeskey321的博客机器学习，实现人工智能的一种方式，统计机器学习，基于数据构建统计模型，利用模型对数据进行分析和预测。人工智能的概念起源于1056年的达特茅斯会议，1966年MIT的可以与人对话的小程序ELIZA；Frank Rosenblatt的...
tensorflow2.x 深度学习使用相同梯度进行梯度下降的两个相同神经网络，得到的结果却不同 tensorflow 深度学习神经网络
2021-03-12 00:07

回答 2 已采纳在上面给的代码的第164行处插入 optimizer = optimizers.Adam(lr=1e-4) 重新初始化optimizer，这样两个模型训练后的测试结果就一样了，望采纳
8.人工智能原理-初识Keras：轻松完成神经网络模型搭建
2023-03-10 16:55

wanlin_yang的博客随着输入数据的特征越来越多，如果一个个的去编写函数表达式未免有点麻烦和拖沓，所以我们...本节课还介绍了Keras，Keras 的开发重点是支持快速的实验。能够以最小的时延把你的想法转换为实验结果，是做好研究的关键。
深度学习基础-keras建立密集神经网络
2020-03-05 21:14

技术蒙童的博客深度学习基础-keras建立密集神经网络
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月19日
展开全部

悬赏问题

¥15 求指导ADS低噪放设计
¥15 CARSIM前车变道设置
¥50 三种调度算法报错有实例
¥15 关于#python#的问题，请各位专家解答！
¥200 询问：python实现大地主题正反算的程序设计，有偿
¥15 smptlib使用465端口发送邮件失败
¥200 总是报错，能帮助用python实现程序实现高斯正反算吗？有偿
¥15 对于squad数据集的基于bert模型的微调
¥15 为什么我运行这个网络会出现以下报错？CRNN神经网络
¥20 steam下载游戏占用内存

Keras建立深度神经网络

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新