CNN圖片分類結果順序亂掉

我这代码是使用预训练模型如InceptionV3、VGG16等做狗的品种分类，但我运行时遇到一个很奇妙的问题，在训练集、验证集的结果都很不错，有达到95%以上，但我自己使用资料测试并将结果输出到EXCEL时，有些种类是全答对(我输入A的图片答B)，有些种类是全答错(我输入B的图片答C，或C的出现率非常高)，我怀疑是在编码时的顺序出了问题，我不论使用InceptionV3、VGG16都得到类似的结果，但我实在找不出问题出在哪里，将前面的资料Print出来顺序也都是对的，不知是哪里出了问题

輸入Airedale圖片全對

輸入Bloodhound圖片全錯

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from tensorflow.keras.preprocessing.image import ImageDataGenerator
# 讀取標籤檔案
labels_df = pd.read_csv("./archive/dogs.csv")
# 選定類別
selected_breeds = ["Airedale", "Beagle", "Bloodhound", "Bluetick", "Chihuahua", "Collie", "Dingo", 
                    "French Bulldog", "German Sheperd", "Malinois", "Newfoundland", "Pekinese", 
                    "Pomeranian", "Pug", "Vizsla"]

# 篩選所需類別
filtered_labels = labels_df[labels_df['labels'].isin(selected_breeds)]
# 將訓練集、驗證集、測試集分割
train_df = filtered_labels[filtered_labels['data set']=='train'].copy()
test_df = filtered_labels[filtered_labels['data set']=='test'].copy()
valid_df = filtered_labels[filtered_labels['data set']=='valid'].copy()
# 資料集路徑
data_dir = "./archive/"

# 資料預處理
label_encoder = LabelEncoder()
train_df['encoded_labels'] = label_encoder.fit_transform(train_df['labels']).astype(str)
valid_df['encoded_labels'] = label_encoder.transform(valid_df['labels']).astype(str)
# 構建完整的檔案路徑
train_df['filepaths'] = data_dir + train_df['filepaths']
valid_df['filepaths'] = data_dir + valid_df['filepaths']
test_df['filepaths'] = data_dir + test_df['filepaths']
# 使用ImageDataGenerator進行數據增強和載入
datagen = ImageDataGenerator(
    rescale=1./255,
)

train_generator = datagen.flow_from_dataframe(
    train_df,
    x_col='filepaths',
    y_col='encoded_labels',
    target_size=(224, 224),
    batch_size=32,
    class_mode='sparse'
)

val_generator = datagen.flow_from_dataframe(
    valid_df,
    x_col='filepaths',
    y_col='encoded_labels',
    target_size=(224, 224),
    batch_size=32,
    class_mode='sparse'
)

from tensorflow.keras.applications import VGG16
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten, Dropout
from tensorflow.keras.optimizers import RMSprop,Adam
from sklearn.model_selection import train_test_split
from tensorflow.keras.regularizers import l2
from tensorflow.keras.callbacks import LearningRateScheduler
from tensorflow.keras.applications import InceptionV3



# 使用 VGG16 預訓練模型
# base_model = VGG16(weights='imagenet', include_top=False, input_shape=(224, 224, 3))
# 使用 InceptionV3 預訓練模型
base_model = InceptionV3(weights='imagenet', include_top=False, input_shape=(224, 224, 3))

# 凍結預訓練模型的權重
for layer in base_model.layers:
    layer.trainable = False
# #逐次降低學習率
# def lr_scheduler(epoch):
#     return 0.0005 * pow(0.9, epoch // 5)
# lr_schedule = LearningRateScheduler(lr_scheduler)
# 建立新的模型，添加全連接層
model = Sequential()
model.add(base_model)
model.add(Flatten())
model.add(Dense(256, activation='relu'))
model.add(Dropout(0.3))
model.add(Dense(256, activation='relu'))
model.add(Dropout(0.3))
model.add(Dense(128, activation='relu'))
model.add(Dropout(0.3))
model.add(Dense(15, activation='softmax'))
model.summary()

# 編譯模型
model.compile(optimizer = RMSprop(learning_rate=0.0001), loss='sparse_categorical_crossentropy', metrics=['accuracy'])

# 訓練模型
model.fit(train_generator, epochs=25, validation_data=val_generator)
# 使用測試集進行預測
test_datagen = ImageDataGenerator(rescale=1./255)
test_generator = test_datagen.flow_from_dataframe(
    test_df,
    x_col='filepaths',
    target_size=(224, 224),
    batch_size=32,
    class_mode=None,
    shuffle=False
)

predictions = model.predict(test_generator)

# 使用驗證集進行性能評估
val_metrics = model.evaluate(val_generator)

# 取得 Accuracy
val_accuracy = val_metrics[1]

# 印出 Accuracy
print("Validation Set Accuracy: {:.2f}%".format(val_accuracy * 100))

import os
import pandas as pd
import numpy as np
from tensorflow.keras.preprocessing import image
from PIL import Image

# 檔案夾路徑
testing_data_folder = "./test_data3/Bloodhound"

# 檔名列表
file_names = [f for f in os.listdir(testing_data_folder) if f.endswith('.jpg')]

# 建立 DataFrame
result_df = pd.DataFrame({'檔名': file_names})

# 製作測試資料集
test_data = []

# 收集預測機率的列表
probabilities = []

for file_name in file_names:
    img_path = os.path.join(testing_data_folder, file_name)
    img = Image.open(img_path)
    img = img.resize((224, 224))
    img_array = image.img_to_array(img)
    img_array = img_array / 255.0  # 歸一化
    test_data.append(img_array)

test_data = np.array(test_data)

# 使用模型進行預測
predictions = model.predict(test_data)

# 類別名稱
# class_names = ["Airedale", "Beagle", "Bloodhound", "Bluetick", "Chihuahua", "Collie", "Dingo",
#                "Bloodhound", "German Sheperd", "Malinois", "Newfoundland", "Pekinese",
#                "Pomeranian", "Pug", "Vizsla"]
# class_names = ["Airedale", "Beagle", "Bloodhound", "Bluetick", "Chihuahua", "Collie", "Dingo",
#                "French Bulldog", "German Sheperd", "Malinois", "Newfoundland", "Pekinese",
#                "Pomeranian", "Pug", "Vizsla"]
# 印出訓練集中每個類別的編碼
print(predictions)

# 使用預測結果對應到的類別標籤
predicted_labels = label_encoder.inverse_transform(predictions.argmax(axis=1))

# 將預測結果加入 DataFrame
result_df['結果'] = predicted_labels

# 將結果保存到 Excel 文件
result_df.to_excel("test_data.xlsx", index=False)

print("結果已成功輸出到 test_data.xlsx 檔案中。")

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

基于卷积神经网络（CNN）的垃圾分类模型研究
2024-06-06 20:02

怎么这么多名字都被占了的博客随着城市化进程的加快，...本文提出了一种基于卷积神经网络（CNN）的垃圾分类模型，该模型能够自动识别并分类不同类型的垃圾。实验表明，该模型在垃圾分类任务中取得了较高的准确率，为垃圾处理提供了有效的技术支持。
【CNN实战】利用CNN对自定义数据集进行分类（附完整代码）
2024-11-08 10:07

小主的学习计划的博客在本篇文章中将详细地、一步一步介绍如何对自己采集到的数据进行预处理，以及如何利用CNN对这些处理好的数据进行分类识别。
深度学习——图像分类（CNN）—训练模型
2024-05-23 11:08

芜蓼的博客 tensorflow.keras.models import Sequential: Sequential模型是Keras中的一种模型，它允许您顺序地堆叠层。 tensorflow.keras.layers: 包含了Keras中所有的层类型，如Conv2D、MaxPooling2D、Flatten、Dense等。 ...
【Pytorch】计算机视觉项目——卷积神经网络CNN模型识别图像分类
2023-11-06 11:10

Avasla的博客介绍卷积神经网络CNN的可视化解释器，分步骤详解如何使用Pytorch搭建CNN模型完成图像分类任务。
基于CNN的医学X-Ray图像分类全程解析
2024-08-09 18:47

wtveyes的博客 width, img_height, 1))) cnn.add(MaxPooling2D(pool_size = (2, 2))) cnn.add(Flatten()) cnn.add(Dense(activation = 'relu', units = 128)) cnn.add(Dense(activation = 'relu', units = 64)) cnn.add(Dense...
AI人工智能领域分类：AI与传统行业融合趋势
2025-06-05 18:09

AI智能架构工坊的博客本文聚焦AI在传统行业的垂直分类与融合趋势，覆盖农业、制造业、医疗、金融、教育五大核心领域，解答“AI如何具体改造传统行业”“不同行业的融合模式有何差异”“未来会出现哪些新机会”等关键问题。本文先通过一个...
CNN 卷积神经网络（MNIST 手写数字数据集的分类）
2026-01-09 20:21

爱打代码的小林的博客本文介绍了使用PyTorch实现MNIST手写数字分类的全过程。首先加载并可视化MNIST数据集，创建DataLoader实现批量数据加载。然后定义了一个包含多个卷积层和全连接层的CNN模型，并配置了GPU加速。通过训练函数实现了...
工作笔记：实现CNN分类网络对不同质量的指纹图像分类
2024-10-11 01:04

YUZHI1314的博客总体顺利，但是败在数据集的标注上。分类要求越高，对应的数据集需求也就越大后续可以把费尽心思构建的模型模块扩大再利用，到时候一键调用多舒服啊。
MLP和CNN在图片识别中的对比——基于猫狗分类项目的实战分析
2025-09-19 15:45

easy2020的博客基于 cats_and_dogs_filtered 数据集，通过 MLP 与 CNN 的对比实验，系统探讨了影响图像分类模型性能的关键因素。实验表明，初始 CNN 模型因训练不充分与数据增强不足导致性能平庸；经优化数据增强、加深网络、引入...
利用CNN对股票“图片”进行涨跌分类——一次尝试
2020-12-17 14:12

BigQuant的博客股票图片：既然使用CNN，那么如果输入数据是股票某个周期的K线图片就太好了。当然，本文中使用的图片并不是在看盘软件上一张一张截下来的，而是利用OHLC数据“画”出来的；尝试：这个词委婉一点说就是“一个很好的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月22日

CNN圖片分類結果順序亂掉

0条回答 默认 最新

问题事件

0条回答默认最新