kaggle模型训练

我的数据集已经划分好了训练、验证和测试，我怎么用训练集进行训练验证集进行验证测试集进行测试呢
我发现我处理后的图像文件夹是空的

# 图像文件夹路径
train_folder = "/kaggle/input/TF/train"
valid_folder = "/kaggle/input/TF/valid"
test_folder = "/kaggle/input/TF/test"

# 定义图像预处理操作
transform = transforms.Compose([
    transforms.RandomHorizontalFlip(),  # 随机水平翻转
    transforms.RandomRotation(degrees=15),  # 随机旋转
    transforms.ColorJitter(brightness=0.2, contrast=0.2, saturation=0.2, hue=0.1),  # 颜色扭曲
    transforms.ToTensor(),  # 转换为张量
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])  # 归一化
])

# 加载RGB图像并进行预处理
def load_rgb_image(folder, filename):
    image_path = os.path.join(folder, filename)
    image = Image.open(image_path)
    transformed_image = transform(image)
    return transformed_image.unsqueeze(0)  # 添加批处理维度


def load_rgb_image(folder, filename):
    image_path = os.path.join(folder, filename)
    if os.path.exists(image_path):  # 检查图像文件是否存在
        image = Image.open(image_path)
        transformed_image = transform(image)
        return transformed_image.unsqueeze(0)
    else:
        print('hello')


def apply_dct_channel(channel, threshold):
    dct_channel = torch.fft.fftn(channel, dim=(-2, -1))  # 离散余弦变换
    dct_channel_filtered = dct_channel * (torch.abs(dct_channel) > threshold)  # 进行阈值过滤
    idct_channel = torch.fft.ifftn(dct_channel_filtered, dim=(-2, -1))  # 离散余弦逆变换
    return idct_channel.real.to(channel.device)  # 返回实部，并将结果放回原设备

def apply_dct(image, threshold):
    r_channel = image[:, 0, :, :]
    g_channel = image[:, 1, :, :]
    b_channel = image[:, 2, :, :]

    r_processed = apply_dct_channel(r_channel, threshold)
    g_processed = apply_dct_channel(g_channel, threshold)
    b_processed = apply_dct_channel(b_channel, threshold)

    processed_image = torch.stack([r_processed, g_processed, b_processed], dim=1)
    return processed_image


def apply_srm_channel(channel, threshold):
    channel_np = channel.numpy()  # Convert Torch tensor to NumPy array
    dct_channel = dct(dct(channel_np, axis=0, norm='ortho'), axis=1, norm='ortho')
    dct_channel_filtered = dct_channel * (np.abs(dct_channel) > threshold)
    idct_channel = idct(idct(dct_channel_filtered, axis=0, norm='ortho'), axis=1, norm='ortho')
    return torch.from_numpy(idct_channel)  # Convert NumPy array back to Torch tensor

def apply_srm(image, threshold):
    r_channel = image[:, :, 0]
    g_channel = image[:, :, 1]
    b_channel = image[:, :, 2]

    r_processed = apply_srm_channel(r_channel, threshold)
    g_processed = apply_srm_channel(g_channel, threshold)
    b_processed = apply_srm_channel(b_channel, threshold)

    processed_image = torch.stack([r_processed, g_processed, b_processed], dim=-1)
    return processed_image
# 创建EfficientNet模型
def create_efficientnet_model(input_shape, num_classes):
    model = efficientnet_b0(pretrained=True)
    model._fc = nn.Linear(1280, num_classes)  # 替换最后一层全连接层
    return model

# 获取文件夹中的所有图像文件名
def get_image_filenames(folder):
    image_filenames = []
    for filename in os.listdir(folder):
        if filename.endswith(".jpg") or filename.endswith(".png"):
            image_filenames.append(filename)
    return image_filenames

# 获取训练集、验证集和测试集的图像文件名
train_filenames = get_image_filenames(train_folder)
valid_filenames = get_image_filenames(valid_folder)
test_filenames = get_image_filenames(test_folder)

# 加载RGB图像
train_rgb_images = []
for i, filename in enumerate(train_filenames):
    rgb_image = load_rgb_image(train_folder, filename)
    train_rgb_images.append(rgb_image)
    print(f"Loading train RGB images: {i+1}/{len(train_filenames)}", end="\r")

valid_rgb_images = []
for i, filename in enumerate(valid_filenames):
    rgb_image = load_rgb_image(valid_folder, filename)
    valid_rgb_images.append(rgb_image)
    print(f"Loading valid RGB images: {i+1}/{len(valid_filenames)}", end="\r")

test_rgb_images = []
for i, filename in enumerate(test_filenames):
    rgb_image = load_rgb_image(test_folder, filename)
    test_rgb_images.append(rgb_image)
    print(f"Loading test RGB images: {i+1}/{len(test_filenames)}", end="\r")

# 执行DCT处理
train_dct_images = []
for i, rgb_image in enumerate(train_rgb_images):
    dct_image = apply_dct(rgb_image, 20)
    train_dct_images.append(dct_image)
    print(f"Applying DCT to train images: {i+1}/{len(train_rgb_images)}", end="\r")

valid_dct_images = []
for i, rgb_image in enumerate(valid_rgb_images):
    dct_image = apply_dct(rgb_image, 20)
    valid_dct_images.append(dct_image)
    print(f"Applying DCT to valid images: {i+1}/{len(valid_rgb_images)}", end="\r")

test_dct_images = []
for i, rgb_image in enumerate(test_rgb_images):
    dct_image = apply_dct(rgb_image, 20)
    test_dct_images.append(dct_image)
    print(f"Applying DCT to test images: {i+1}/{len(test_rgb_images)}", end="\r") 
    
# 执行SRM处理
train_srm_images = []
for i, rgb_image in enumerate(train_rgb_images):
    srm_image = apply_srm(rgb_image, 20)
    train_srm_images.append(srm_image)
    print(f"Applying SRM to train images: {i+1}/{len(train_rgb_images)}", end="\r")


#---------------

for i, rgb_image in enumerate(train_rgb_images):
    dct_image = apply_dct(rgb_image, 20)
    if dct_image is not None:  # 检查图像是否为空
        train_dct_images.append(dct_image)
        print(f"Applying DCT to train images: {i+1}/{len(train_rgb_images)}", end="\r")

    
valid_srm_images = []
for i, rgb_image in enumerate(valid_rgb_images):
    srm_image = apply_srm(rgb_image, 20)
    valid_srm_images.append(srm_image)
    print(f"Applying SRM to valid images: {i+1}/{len(valid_rgb_images)}", end="\r")

test_srm_images = []
for i, rgb_image in enumerate(test_rgb_images):
    srm_image = apply_srm(rgb_image, 20)
    test_srm_images.append(srm_image)
    print(f"Applying SRM to test images: {i+1}/{len(test_rgb_images)}", end="\r")
# 将图像和标签转换为模型输入的张量格式
train_images = torch.cat(train_rgb_images, dim=0)
valid_images = torch.cat(valid_rgb_images, dim=0)
test_images = torch.cat(test_rgb_images, dim=0)

train_labels = torch.tensor([0] * len(train_filenames))
valid_labels = torch.tensor([0] * len(valid_filenames))
test_labels = torch.tensor([0] * len(test_filenames))


#--------------------------------------------------
报错如下：---------------------------------------------------------------------------
RuntimeError                              Traceback (most recent call last)
Cell In[26], line 2
      1 # 将图像和标签转换为模型输入的张量格式
----> 2 train_images = torch.cat(train_rgb_images, dim=0)
      3 valid_images = torch.cat(valid_rgb_images, dim=0)
      4 test_images = torch.cat(test_rgb_images, dim=0)

RuntimeError: torch.cat(): expected a non-empty list of Tensors

求解，我怀疑和自己文件路径有关系，我数据集有train、valid和test，三者中分别含有real、fake两个子文件夹，分别包含对应的图像

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2024-01-15 20:23
关注
【以下回答由 GPT 生成】

从提供的代码中来看，加载图像的函数load_rgb_image中使用了Image模块来打开图像文件，并进行了预处理操作。在预处理操作之后，使用torchvision.transforms.ToTensor()方法将图像转换为张量，并使用torchvision.transforms.Normalize()方法进行归一化处理。

在使用load_rgb_image函数加载图像时，你需要确保以下几点：

检查图像文件夹路径train_folder，valid_folder和test_folder是否正确设置，并且这些文件夹包含了对应的图像文件。你可以使用os.path.exists方法检查文件夹是否存在。
检查图像文件是否存在于对应文件夹中。你可以通过在load_rgb_image函数中添加一个判断语句来检查图像文件是否存在。如果图像文件不存在，可以打印出相应的错误提示。

下面是对load_rgb_image函数的修改示例：

def load_rgb_image(folder, filename): image_path = os.path.join(folder, filename) if os.path.exists(image_path): # 检查图像文件是否存在 image = Image.open(image_path) transformed_image = transform(image) return transformed_image.unsqueeze(0) else: print('图像文件不存在:', image_path)

通过以上步骤，你可以对图像文件进行检查，并输出相应的错误信息来解决图像文件夹为空的问题。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Kaggle训练Yolov5模型 python 有问必答
2022-04-08 20:06

回答 2 已采纳指令输进去,类似于python train.py --.yaml --cfg .yaml --weights pretrained/yolov5s.pt --epoch 100 --batch-siz
采用kaggle训练yolov5口罩模型，出现Dataset not found问题 opencv 人工智能计算机视觉
2022-10-22 11:19

回答 1 已采纳
kaggle泰坦尼克 python 有问必答
2022-01-24 23:14

回答 5 已采纳你输出一下最终处理完的titanic，你看一下里面有没有survived字段或者输出一下列名看一下：titanic.columns
Kaggle Titanic Challenges 生存预测数据预处理模型训练交叉验证步骤详细解析
2019-03-18 22:46

Leonardo Liu的博客本博客所有内容均整理自...看《Hands-On》一书至第三章，习题里面后两题是实际操作的编程题，自己初步动手效果不错，特此记录一下。运行环境：Jupyter Notebook 语言：Python3.6.4 0、题目描述 Kaggle的Tita...
kaggle平台不能删除已有的框架吗 tensorflow 机器学习自然语言处理
2022-10-29 13:00

回答 1 已采纳这种情况在后面打一个”Y“试试其实tensorflow2.0版本和1.0版本的相差很大，如果你用的是2.0版本的，但代码是1.0，可以在引入模块中加入以下语句import tensorflow.com
在做kaggle中的titanic为什么报错呢？机器学习
2018-11-24 10:02

回答 3 已采纳该问题是由于sklearn中模块的迁移和更新导致的 **解决方法一**：不理会版本情况直接将 ``` from sklearn.model_selection import KFold
CBIS-DDSM kaggle 资料处理 python 数据分析数据挖掘
2023-02-06 16:18

回答 3 已采纳 #复制文件函数 def copy_files(l,dd): for n in range(len(dd)): d=re.findall(r'/(.*)/', dd.loc[n,
AI大模型探索之路-训练篇4：大语言模型训练数据集概览
2024-04-26 17:20

寻道AI小兵的博客在人工智能领域，构建强大的AI系统的关键步骤之一是大规模的语言模型预训练。为了实现这一目标，需要大量且多样化的训练数据。以下是对目前常用于训练大语言模型的数据集的整理与概述。
kaggle现在是不是提交不了答案了？机器学习
2021-07-11 08:47

回答 1 已采纳之前遇到是因为网络不稳定，连上VPN就好了
kaggle云端部署的stable diffusion运行时Lora模块没法儿用 python
2023-03-27 12:09

回答 2 已采纳看起来是lora.py文件中的lora_apply_weights函数出了问题，函数中使用了“|”操作符，但是“|”操作符不支持type类型，所以报错了。可以尝试把“|”操作符改成“or”，看看是否可
kaggle CBIS-DDSM 依照breast density分类图片 python 数据挖掘机器学习
2023-03-23 16:48

回答 4 已采纳 import os import shutil import pandas as pd import re import cv2 #区分roi和cropped图片 def classify_img
大语言模型(LLM)入门学习路线图
2024-02-28 17:36

Kk-Quiana的博客 Github项目上有一个，它涵盖了大语言模型基础学习，LLM前沿算法和架构学习，以及如何将大语言模型进行工程化，是一个很好的帮助初学者入门大语言模型的路线图。
keras训练卷积神经网络模型总是中断，发生未知错误 keras 机器学习深度学习
2021-11-15 18:25

回答 2 已采纳更新下pillow看看，如果还是这样，这张图片有问题，要么是你直接改的后缀而不是通过转换，要么是这种图已经损坏了，无法读取了
大模型（LLM）的训练语料信息汇总
2024-03-03 11:02

enjoy编程的博客大模型的训练，大规模的语料是很重要的大型语言模型在许多自然语言...这几个数据集是最常用的，基本上大部分大模型训练过程都会使用到，其中CommonCrawl的数据集比较大，而wiki Pedia的数据集比较规整相对来说比较少
Kaggle首战拿金牌总结！
2022-05-30 22:33

AI蜗牛车的博客今天给大家分享一篇大佬参加Kaggle的经验文章，作者是一名阿里算法工程师，希望对也想玩转Kaggle竞赛的朋友有所帮助，以下为原文。作者：jiazhuamh | 编辑：对白的算法屋https://zhuanlan.zhihu.com/p/60953933这篇...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月15日

悬赏问题

¥15 phython如何实现以下功能？查找同一用户名的消费金额合并—
¥15 ARIMA模型时间序列预测用pathon解决
¥15 孟德尔随机化怎样画共定位分析图
¥18 模拟电路问题解答有偿速度
¥15 CST仿真别人的模型结果仿真结果S参数完全不对
¥15 误删注册表文件致win10无法开启
¥15 请问在阿里云服务器中怎么利用数据库制作网站
¥60 ESP32怎么烧录自启动程序，怎么查看客户esp32板子上程序及烧录地址
¥50 html2canvas超出滚动条不显示
¥15 java业务性能问题求解(sql，业务设计相关)

kaggle模型训练

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新