请问图像识别的数据集应该怎么建立？

请问想做一个图像识别的城厢，但是想要识别的物体比较偏门，网上没有图像，应该怎么样建立自己的数据集呢？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-02-17 22:38
关注
引自免费微信小程序：皆我百晓生

创建一个自定义图像识别的数据集需要经过以下几个步骤，由于实际操作中无法直接提供代码或图片模拟（AI文本环境限制），我将详细描述每个步骤，并在可能的情况下给出示例代码片段：

1. 数据收集

对于偏门物体的图像识别，首先需要自行收集相关物体的大量照片。确保这些照片包含不同角度、光照条件、背景变化等多样化的场景。

拍摄方式：使用高质量相机从多个角度和距离拍摄目标物体。
标注信息：每张图片都要有对应的类别标签（例如是何种物体）；如果做细粒度识别，可能还需要关键点或者边界框标注。

2. 数据整理与预处理

文件组织：按照类别名建立子文件夹，将对应类别的图片存放在相应的子文件夹内。
数据预处理：对图片进行缩放、裁剪、色彩归一化等预处理，以满足模型输入要求。

# 假设已经读取并预处理了一张图片 import cv2 from PIL import Image def preprocess_image(image_path): img = cv2.imread(image_path) img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) # 转换颜色空间到RGB img = Image.fromarray(img) img = img.resize((img_size, img_size)) # 将图片缩放到固定大小 return img # 遍历目录下的所有图片进行预处理 for category in categories: for image_file in os.listdir(category_dir): preprocessed_img = preprocess_image(os.path.join(category_dir, image_file)) # 保存预处理后的图片

3. 创建数据集结构

使用类似torchvision.datasets.ImageFolder的方法来构建符合PyTorch或其他框架要求的数据集格式，也可以自己编写数据加载器。

import torchvision.datasets as datasets from torch.utils.data import DataLoader class CustomDataset(datasets.ImageFolder): def __init__(self, root, transform=None, target_transform=None): super().__init__(root=root, transform=transform, target_transform=target_transform) dataset = CustomDataset(root='path_to_your_dataset') dataloader = DataLoader(dataset, batch_size=batch_size, shuffle=True, num_workers=num_workers)

4. 数据标注

如果还没有标签信息，可以使用开源工具如LabelImg、RectLabel等进行人工标注，并将标注结果存储为.xml或.json等格式，然后根据格式将其转换成训练所需的标签文件。

5. 数据增强

为了提高模型泛化能力，可以采用数据增强技术，比如随机翻转、旋转、裁剪等。

from torchvision.transforms import transforms data_transforms = transforms.Compose([ transforms.RandomHorizontalFlip(), transforms.RandomRotation(10), transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ]) dataset.transform = data_transforms

总结

以上只是创建图像识别数据集的基本流程，具体实现时请根据实际情况调整代码和方法。当准备好数据集后，你就可以使用深度学习框架（如TensorFlow、PyTorch等）训练自己的图像识别模型了。
解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

TensorFlow 里面图像分类数据集怎么获得？？？ tensorflow 机器学习神经网络计算机视觉
2018-11-08 01:14

回答 1 已采纳初学者可以找ImageNet 数据集，已经标注好了。图像分类的代码，google里面搜索tensorflow cnn image classfication，有很多自己标注不是不可以，只是
做图像处理，没有数据集咋办？ python 人工智能有问必答深度学习
2021-10-14 18:36

回答 2 已采纳可以看看这里：https://medium.datadriveninvestor.com/detection-and-classification-of-apple-tree-disease-base
学习图像识别技术需要用到什么知识？图像处理
2022-08-23 12:11

回答 1 已采纳机器学习开始学起，中间穿插一下数字图像处理（一般是学opencv），最后转到深度学习，OpenBR，yolo是开源仓库，前者是cpp库，用来做生物特征识别的，类似opencv一样的仓库，后者是神经网络
编程语言和文件格式检测数据集.zip
2024-02-16 17:12

本数据集，名为"编程语言和文件格式检测数据集.zip"，旨在为这个领域提供一个宝贵的资源，帮助开发者和研究人员更有效地识别和理解编程语言以及文件格式。数据集的多样性使得它适用于各种任务，如语料库构建、机器...
图像分割后进行识别，和直接进行图像识别那个效果好点？机器学习深度学习神经网络
2021-05-29 12:55

回答 1 已采纳这是两种不一样的解决问题的思路，在很多领域都存在。你导师说的那种思路是Pipeline，你说的那种思路叫做end2end，各有优缺点。Pipeline是将一个问题拆解成若干个子问题一次解决，然后串在一
细粒度图像识别到底是什么？ python 人工智能有问必答神经网络
2021-09-17 09:36

回答 1 已采纳人脸识别应该包含条件触发、抓取图像、人脸检测、图像预处理、特征提取、特征匹配、活体检测、条件判断及产生动作几个主要动作，其中人脸检测（face detection）、特征提取（feature extr
关于CNN图像识别的简单问题？ tensorflow 深度学习神经网络
2021-03-04 17:57

回答 2 已采纳 1. Tensorflow 是一个用于深度学习的开源库，它帮你封装好了各种深度学习的算法，所以非常容易上手使用，支持python和C/C++ 2. tensorflow, pytorch等库都可以用
舌头图像训练数据集舌头图像训练数据集
2020-11-26 15:19

在这个“舌头图像训练数据集”中，我们主要探讨的是如何利用图像识别技术，特别是与Python相关的库和方法，来处理和分析舌头的图像数据。这个数据集包含了两个部分：posdata_40和negdata，分别代表了两类不同的舌头...
请问如何从哈佛大学医学院的医学图像库的下载图片数据呢？图像处理数据分析深度学习
2022-02-16 10:58

回答 3 已采纳
图像修复的数据集制作 python 深度学习生成对抗网络
2022-12-28 18:01

回答 1 已采纳你可以使用OpenCV库来实现将不规则mask添加到原图上的操作。首先读取原图和mask图片，并使用cv2.bitwise_and()函数将mask图片与原图进行位运算，得到一张有缺失部分的图像。
请问如何直接用一次unique函数处理一个数据集? python 数据结构机器学习
2022-06-02 12:22

回答 1 已采纳 res = penguins.apply(lambda x:x.unique(),axis = 0) print(res)
船舶图片数据集.rar
2021-04-27 20:54

这种数据集通常被用来训练图像识别、目标检测或分类算法，帮助计算机理解并识别不同类型的船舶。描述中提到“收集两千多张海面船舶图片”，这暗示了数据集的规模，即包含2000多张图片，这些图片可能涵盖了不同类型...
请问opencv怎么实现单个图片多个目标的图像识别 opencv
2017-12-21 03:29

回答 2 已采纳是否可以这样考虑，先用找轮廓的方法，把所有的目标轮廓找出来，以凸包的形式切成一张张的只包含一个目标的图片，再对每个图片进行目标识别。
基于机器学习的植物病害检测的图像识别.zip
2024-05-01 22:05

项目使用的数据集包括公开的植物病害图像数据集，如PlantVillage等，并进行了预处理，包括图像增强、分割和特征提取等。在运行环境方面，我们使用Python编程语言，基于TensorFlow、PyTorch等深度学习框架进行开发。...
MNIST CSV数据集
2023-06-26 23:45

然而，有时将MNIST数据集转换为CSV格式可以更方便地在各种编程环境中使用，因为CSV格式可以轻松地导入到许多数据处理工具和编程语言中，包括MATLAB。在MNIST CSV数据集中，每个图像被展平为一维向量，并存储在CSV...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月17日

悬赏问题

¥15 请问python的selenium怎么设置referer
¥15 请教下， VS QT 环境下， QTOPCUA 的源文件报错，这种情况咋查呢？
¥20 UNITY webgl关于文档的上传和下载问题
¥15 安霸cv22 + rtl8211f 千兆，udp传输丢包
¥15 关于区块链和边缘环境搭建的相关问题
¥15 windows远程桌面断卡重连软件卡顿问题
¥30 Unity 实现扫描效果
¥15 HbuilderX检测不到安卓模拟器
¥15 这个main已经在filename.obj中定义是什么错 C语言
¥15 关于#linux#的问题：exsi8.0系统怎么更改web访问端口，不用80、443

请问图像识别的数据集应该怎么建立？

5条回答 默认 最新

1. 数据收集

2. 数据整理与预处理

3. 创建数据集结构

4. 数据标注

5. 数据增强

总结

问题事件

悬赏问题

5条回答默认最新