图像分类中数据集的问题

目前在学习图像分类，用过MNIST的数据集，格式是.npz,用过cifar-10,格式是好几个
(data_batch)
我想问的是，我自己有整理的数据集，有10个种类的文件夹，每个文件夹里对应的图片，我这种如何预处理？要不要也改成像MNIST那样的格式？那种格式怎么弄的？为什么那么弄？求解

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2018-11-19 12:42
关注
你的图看不到，预处理取决于你的模型的输入，或者反过来说，你的模型的输入要和你的数据一致。
因为看不到图，我不知道你说的现在的图片是什么样的，但是一般来说，你需要在预处理中做以下几条：
（1）不要用jpg png这些格式，统一转换为bmp，相同的颜色深度
（2）最好将图片缩放、裁剪成为统一的长宽高度，并且，为了性能的考虑，图片的大小在不影响识别率的前提下，越小越好
（3）实际上bmp的头部也是不需要的，可以进一步转换为只有像素点的[x,y,3]形式的数据，x y是图片的长宽，而3表示r g b三个分量的值
（4）建议你文件名也用有意义的名字，比如说分类的标签，这样主程序操作起来比较方便

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

AI动物识别图像分类数据集
2024-01-02 13:46

在当前的数字化时代，人工智能（AI）已经成为科技发展的重要推动力，特别是在图像处理领域，AI的应用日益广泛。这个名为“AI动物识别图像分类数据集”的资源正是为了培养和提升AI模型进行动物识别能力而设计的。它...
猫狗图像分类数据集(1400)
2022-05-17 17:25

4. **人工智能**：数据集是人工智能研究的一部分，尤其是深度学习，用于构建智能系统识别图像中的猫和狗。 5. **图像分类**：这是具体的技术任务，通过训练神经网络模型，如卷积神经网络（CNN），来实现图像的自动...
真实和 AI 生成的人脸图像数据集（每个约 5k）JPG
2024-09-19 11:36

然而，随着技术的发展，真实和AI生成的人脸图像的区分也变得日益重要，这就需要大量的图像数据集来进行机器学习和深度学习模型的训练和测试。本数据集“真实和AI生成的人脸图像数据集（每个约5k）JPG”正是为了...
可用于相机图像与AI生成的图像分类数据集
2025-04-07 12:23

本次介绍的数据集名为“可用于相机图像与AI生成的图像分类数据集”，它针对的是区分传统相机拍摄的图像和由人工智能生成的图像这一特定问题。这一任务的挑战性在于，随着技术的进步，人工智能生成的图像质量越来越高...
岩石分类数据集，大约1000多张
2024-03-21 17:02

标题中的“岩石分类数据集，大约1000多张”指的是一个专门用于岩石分类的图像数据集，其中包含了大约1000张各种类型的岩石图片。这样的数据集是机器学习，特别是深度学习领域中训练模型的重要资源。数据集的目的是...
肺炎X光图像分类数据集[项目源码]
2025-11-15 07:45

尽管存在上述挑战，肺炎X光图像分类数据集的发布预示着AI在医疗领域应用的广阔前景。通过与医学专家的合作，研究人员可以不断改进算法，开发出更加高效和精准的诊断工具。这些工具不仅可以提高诊断的准确性和效率，...
【人工智能数据集】图像文本音频数据集分类及应用指南：涵盖各类AI训练场景的数据资源介绍与使用建议
2025-05-10 22:07

内容概要：本文档提供了AI训练常用数据集的分类指南，涵盖了图像类、文本类以及多模态数据集。图像类数据集包括用于手写数字识别的基础训练集MNIST、适用于多目标检测的COCO、针对自动驾驶的KITTI和CityScapes、以及...
人工智能图片分类数据集-花卉识别数据集(共5种3600张图片)
2024-01-15 11:37

花卉识别数据集(共5种3600张图片)包括雏菊、蒲公英、玫瑰、向日葵、郁金香。
图像识别，垃圾分类数据集
2023-03-29 23:02

本数据集为基于Java+AI的智能垃圾分类APP所用数据集，为图片集训练出来，如果有做类似垃圾分类识别，可尽管拿走。
人工智能目标检测数据集（战车卫星图）
2022-01-21 15:55

这个数据集专为研究人工智能中的目标检测算法而设计，包含1000张彩图，每张图像的尺寸为1024x1024像素，目标类别为战车，且图像来源于卫星图。以下是对这些关键概念的详细解析： 1. **人工智能（AI）**：人工智能是...
没有解决我的问题, 去提问

图像分类中数据集的问题

3条回答 默认 最新

3条回答默认最新