简单cnn网络，csv数据集，bug解决

说明：跟教程学搞了一个神经网络，一共283个样本，每个样本144个特征（样本数据data_trans.csv），样本标签是10分类（标签文件data_label_10.csv），样本都是csv格式的，模型是随便抄的很简单的cnn。

问题1：在Dataloader中设置的batch_size=10，为什么在Conv1卷积层中in_channel设为1会出bug，设置为batch_size一样的10才行，样本本身就是1维的啊。
问题2：Linear层out_features设为10会报错，“mat1 and mat2 shapes cannot be multiplied (5x144 and 720x10)”，是哪个参数设置错误了啊？
问题3：请帮忙处理bug，能跑通就行。

代码和数据csv文件都在Github里，链接https://github.com/sizimiya/CSDN-Question.git

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

脚踏南山 2022-08-31 09:25

关注

有用记得采纳，batch_size=随便改

# -*- coding: UTF-8 -*-
"""
@项目名称：简单cnn网络_csv数据集_bug解决.py
@作   者：陆地起飞全靠浪
@创建日期：2022-08-31-09:20
https://ask.csdn.net/questions/7779923
https://blog.csdn.net/weixin_41944061?type=ask
"""

import pandas as pd
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader
from tqdm import tqdm
from datetime import datetime


class CsvDataset(Dataset):
    def __init__(self):
        super(CsvDataset, self).__init__()

        self.feature_path = 'data_trans.csv'
        self.label_path = 'data_label_10.csv'

        feature_df_ = pd.read_csv(self.feature_path)
        label_df_ = pd.read_csv(self.label_path)

        assert feature_df_.columns.tolist()[1:] == label_df_[label_df_.columns[0]].tolist(), \
            'feature name does not match label name'

        self.feature = [feature_df_[i].tolist() for i in feature_df_.columns[1:]]

        self.label = label_df_[label_df_.columns[1]]

        assert len(self.feature) == len(self.label)

        self.length = len(self.feature)

    def __getitem__(self, index):
        x = self.feature[index]
        x = torch.Tensor(x)
        x = x.reshape(1,12, 12)

        y = self.label[index]

        return x, y

    def __len__(self):
        return self.length


train_dataset = CsvDataset()

train_loader = DataLoader(dataset=train_dataset, batch_size=2,  shuffle=False)


class SimpleModel(nn.Module):
    def __init__(self):
        super(SimpleModel, self).__init__()
        self.conv1 = nn.Conv2d(in_channels=1, out_channels=3, kernel_size=(1, 1))  # ***************************
        self.conv2 = nn.Conv2d(in_channels=3, out_channels=5, kernel_size=(1, 1))
        self.relu = nn.ReLU(inplace=True)
        self.flatten = nn.Flatten(start_dim=1, end_dim=-1)  # (B, C, H ,W)
        self.linear = nn.Linear(in_features=5 * 12 * 12, out_features=10, bias=False)  # ****************************

    def forward(self, x):
        x = self.conv1(x)
        x = self.relu(x)
        x = self.conv2(x)
        x = self.relu(x)
        print("[before flatten] x.shape: {}".format(x.shape))  # torch.Size([1, 5, 12, 12])
        x = self.flatten(x)
        print("[after flatten] x.shape: {}".format(x.shape))  # torch.Size([1, 720])
        x = self.linear(x)
        x = self.relu(x)
        return x


model = SimpleModel()

optimizer = optim.SGD(params=model.parameters(), lr=0.0001, momentum=0.9)
loss_fn = nn.CrossEntropyLoss()

for epoch in range(2):
    with tqdm(train_loader, desc='EPOCH:{}'.format(epoch)) as train_bar:
        for (x, y) in train_bar:
            optimizer.zero_grad()
            loss = loss_fn(model(x), y)
            loss.backward()
            optimizer.step()
    print('epoch:{}, loss:{:.6f}'.format(epoch, loss))

time = str(datetime.now()).split('')[0].replace('-', '_')
torch.save(model.state_dict(), 'model_{}.pth'.format(time))

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(1条)

报告相同问题？

关注问题

csv格式数据集预处理及模型选择？数据集又如何处理分割?
2024-12-03 14:44

bug菌¹的博客传统机器学习模型：如 Logistic Regression、SVM，适合较小数据集，使用 TF-IDF 特征。深度学习模型：如 LSTM、GRU，适合较大数据集，需要文本序列化和填充。预训练语言模型：BERT 和 RoBERTa 等模型在 NLP 任务中...
016基于CNN卷积网络的人脸识别打卡签到_resnet_mobilenet_efficientnet等
2023-03-17 22:29

bug_creat0r的博客 02train.py会读取txt文本中的图片进行训练模型，训练得到的模型保存在weights文件夹下，运行01数据集文本生成制作.py会将dataset文件下的数据集中的图片路径保存在txt文本中。最后会保存打卡人物和时间到csv文件内。...
K-Radar数据集怎么下载和使用？
2025-04-30 21:45

bug菌¹的博客本文收录于《全栈Bug调优(实战版)》专栏，致力于分享我在项目实战过程中遇到的各类Bug及其原因，并提供切实有效的解决方案。无论你是初学者还是经验丰富的开发者，本文将为你指引出一条更高效的Bug修复之路，助你...
数据库故障排查指南：字符集配置错误导致乱码的解决方案与大数据分析应用
2025-05-16 09:02

百态老人的博客网络故障：网络分区或延迟导致通信中断。资源耗尽：磁盘满、CPU/内存过载、连接数超限。人为操作错误：误删数据、恶意攻击或字符集配置错误。字符集配置错误：属于软件配置类故障，直接导致数据存储和显示异常。字符...
【项目实战】使用CNN和Keras进行交通标志识别（Python源码）
2025-09-20 22:48

干了这一碗BUG的博客本研究提出基于卷积神经网络(CNN)的交通标志识别系统，以解决冬季标志识别困难导致的交通事故问题。通过数据增强技术扩充训练样本，构建包含4个卷积层和3个全连接层的深度网络模型。实验使用4170张图像数据，经过50...
Python+Django+Mysql开发个性化电影推荐系统 movielens数据集基于机器学习/深度学习/人工智能 基于用户的协同过滤推荐算法爬虫可视化数据分析
2024-01-12 11:44

linge511873822的博客后台管理员包含：数据分析、用户管理、电影管理、电影类型管理、用户喜好标签管理、评分管理、收藏管理、评论管理、浏览记录管理等。个性化推荐功能：游客：热点推荐（根据电影总评分降序推荐）; 登录用户：基于...
【过拟合】深度学习卷积神经网络训练测试集准确率acc=1和验证集准确率val_acc=1 的问题分析与解决+csv文件作为深度学习标签导入+cv2.error: OpenCV(4.1.0)错误解决
2020-05-09 02:13

王宜宝很牛的博客 2020/5/6——2020/5/7记录 1读标签读csv文件作为深度学习标签将csv文件另存为.csv（逗号分割）文件，然后用记事本打开，将“”，全...python 使用opencv读取图片，解决cv2.error: OpenCV(4.1.0) C:\projects\op...
企业AI数据资产评估的实战技巧：AI应用架构师总结的6个方法
2025-08-01 22:25

AI应用架构探索者的博客环节质量指标计算方式数据采集完整性（实际采集数量/计划采集数量）×100%准确性（真实数据数量/总采集数量）×100%数据清洗去重率（重复数据数量/总数据数量）×100%缺失值率（缺失字段数量/总字段数量）×100%数据...
基于CNN-RNN的医疗文本生成
2022-06-23 16:36

猿知的博客本项目使用经过IMAGENET预训练的resnet101网络图像特征进行提取后，将图像特征输入LSTM来生成影像的文本描述。初步实现了图像到文本的简单生成。
时间序列预测实战(十一)用SCINet实现滚动预测功能(附代码+数据集+原理介绍）
2023-11-11 00:35

Snu77的博客这篇文章给大家带来的是关于SCINet实现时间序列滚动预测功能的讲解，SCINet是样本卷积交换...模型我用了两个数据集进行测试，一个是某个公司的话务员接线量一个是油温效果都不错，我下面讲解用油温的数据进行案例的讲解
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月31日

简单cnn网络，csv数据集，bug解决

2条回答 默认 最新

问题事件

2条回答默认最新