怎样用机器学习识别图片中的重要部分

新手,最近在做一个项目,想以一定尺寸裁剪所给图片,使得裁剪出来的部分是图片的重点内容,想请教怎样用机器学习完成这项工作。

8个回答

个人理解:
0.准备你需要的环境 eg:Matlab、vs、opencv
1.准备有关图片重要内容的数据集(训练集(正负样本)+测试集)
2.可以采用传统方法,使用特征+分类器训练数据。
针对要检测内容选取合适的特征(HOG,LBP,SIFT,Edglet特征等)和分类器(有SVM和Adaboost)
比如行人的话,经典的是HOG+SVM,人脸的话是Haar+Adaboost,一般性物体的话可以是HOG+DPM算法。
3.测试数据
当然还可以用深度学习RCNN系列。你可以选取传统方法先入个坑,但是弄到最后也还是会慢慢到深度学习上的,不过个人感觉能深入了解下传统方法对以后深度学习也是有好处的。以上关键词详情可以查,网上有很多资料。如果您觉得能帮到你,希望能采纳。 :-P

解决问题分两步:
1. 图片中什么是重要的;
2. 裁剪该部分

step1分情况:
1)如果是特定场景图片,比如人脸,车辆,有特定的检测方法(传统方法或者CNN都可以)
2)一般物体检测的方法 (RNN系列)
3)显著性物体检测方法(看程明明老师或者卢湖川老师的论文,有代码)
step2:
step1中的1,2两种情况直接给出所需要裁剪的区域
step1中的第3种情况,给出每个像素是否显著的概率,把概率高的像素区域提取出来即可

谢谢 望采纳!

机器学习有很多分支,比如深度学习,你这个可以用深度卷积神经网络(dcnn)
如果不想从底层写,可以调用opencv

。。。。。。。。。。。。。。。。。。。。。。。。

可以理解为目标检测问题,使用R-CNN系列的方法可以解决

重点内容的定义是什么?有点类似目标检测任务,可以利用现在流行的神经网络R-CNN去完成

选好工具,然后查找一些可以参考的源程序,多调试

定位重点内容,可以使用传统模式匹配方式利用opencv,或使用深度学习方式,需要大量标注样例。

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
框架重要部分
1.认识并简单的应用qt,达到可以做一些自己的小例子 2.qt与osg是如何传递消息的,如何进行通信 3.了解三维是如何显示在里rn有问题咨询老师微信,微信号:mikeshizhanbiao
识别图片中的数字
OCR识别图片中数字,并显示在textbox中
识别图片中的英文字母
可以轻松地识别图片上的英文字母,安装后将图片拖入软件中或者自己手动打开,接着就可以自动识别,精度虽然有点差,但是影响不大。
识别图片中的二维码
- (void)qrScan:(UIImage *)image{     CIImage *ciImage = [[CIImage alloc] initWithCGImage:image.CGImage options:nil];     CIContext *context = [CIContext contextWithOptions:@{kCIContextUseSoftwareRen...
百度地图的重要部分
public class LocationActivity extends AppCompatActivity { private MapView mMapView; private BaiduMap baiduMap; //定位客户端 public LocationClient mLocationClient = null; //定位监听器 pub
对图片中圆的识别,模糊识别
对图片中圆的识别,模糊识别 能得到圆的大小和位置
怎样用字符串识别控件
dim a as objectrnset a=text1rna="bbbbb"rn这样可以运行并且Text1的内容变成了bbbbbrn我想实现rndim a as objectrndim b as stringrnb="Text1"rn.......rn.......rna="bbbbb"rn也想让Text1的内容变成bbbbbrn不知哪位老大能搞定?rnrn
怎样用xsl识别xml中的路径?
例如:rnrn rn 100rn rnrnrn用什么样的xsl语言,才能得到c的路径是a/b/crn请高手帮助!
识别图片
背景       队友发了一张bmp图给我,而我发现这张图虽然用电脑默认软件打开显示正常但在一些程序里打不开。问过队友后他跟我说这个图本来是png他直接改了后缀为bmp发我的。于是我花了点时间对图片进行研究,主要是为了以后可以快速识别图片特性。目录1.   RGB565、RGB888是什么?2.   怎么识别出bmp图片是1中分类的哪一种?3.    怎么将图片在这bmp、jpg、png类型中互相...
图片的识别
搜索引擎大家并不陌生,人们都在通过它查询到很多对自己有用的信息,曾几何时大家希望以一个参照图片交予搜索引擎,通过它来查询到类似的图片.很多开发
关于识别图片中的汉字
每个图片中的上方都有固定的几个汉字(图片的标题),这些汉字只有可能是10个词中的某一个,而且是非常标准的黑色字体。rn假设“你好”这个词,应该如何对比以确定到底是哪一个词?
识别pdf图片中的文本
pdf中有一张图片,图片中有中英文文本,有阿拉伯数字,用什么方法才能把图片中的文本识别出来,本人用Java开发的,不提倡用软件,谢谢。
怎样识别图片中的数字?
图片上是从扫描仪扫过来的条形码,现在要识别这些条形码上的数字,请问有什么简单的算法可以实现么,或者有API?rn如果用到OCR技术肯定是来不及的,2天后就要交了。
如果识别图片中的数字
在不,一个图片中,只有0-9,a-b的数字,如果要识别读出数据来,有相关的算法没
python 图片中的表格识别
表格图片的内容识别 接到个任务需要将几万张带表格的图片转换成结构化数据。 1. 大步骤 最终算是完成任务,但是识别率上还有一点问题,人工再过一下,还是蛮快的。先说一下大的步骤: 1. 分割单元格。将图片中的表格全部定位出来,然后按单元格裁剪成一个个小图片,以便后续分析及操作; 2. 聚焦。其实就是将单元格中的文本区域裁剪出来,将多余的空白去掉; 3. 大图片的识别。对于大图片用图像...
java识别图片中的文字
1.新建一个javaweb项目 2.导入sdk及jar包 jar包下载地址:登录百度云,进入百度云管理中心,选择文字识别,创建应用,获取 3.新建类:import java.util.HashMap; import org.json.JSONObject; import com.baidu.aip.ocr.AipOcr; public class Sample {     //设置APPID...
黑体字在bmp图片中的识别
初步研究了对于图片中字母 数字 汉字的识别问题,对于验证码的识别程序有点帮助!
Python 识别图片中表格
— coding:UTF-8 — from skimage import io, data, morphology, segmentation import numpy as np from PIL import Image import pytesseract import os pytesser3.tesseract_exe_name=“C:/Program Files (x86)/Tesse...
如何识别图片中的文字
图片是这种形式的 tel.asp?tel=4A59404F47424A5843435B47rn应该是二进制数据流吧rnrnAspriseOCR可以识别本地图片的文字。rnMarshal.PtrToStringAnsi(OCR(@"D:\tel.bmp", -1));这个可以实别。rn但是网址形式的,我实现不了。 是不是得先把网址形式的图片转换一下,再识别啊。rn具体代码不知道怎么写。请各位老师指导一下。谢谢了!
OCR(图片中识别文字)
能够识别有文字的图片中的文字数据,以便读取数据信息。比较好用的。
识别图片中的文字代码
识别图片中的文字,使用百度云的sdk,具体步骤可以去我的博客中 查看,代码很简单,或者直接去百度云,百度云上写的很详细。
face++识别图片中的文字
首先需要去face++官网注册账号 地址https://www.faceplusplus.com.cn/ 创建一个应用拿到api_key和api_secret 直接上代码 注释都有 public function content(){ if(request()->isPost()){ $img = request()-...
机器学习行人重识别
该资源是文档形式主要讲述的是如何利用度量学习与局部显著性学习相结合实现对行人重识别。
如何识别图片中的道路
本人新人一个,刚接触Opencv,不禁赞叹其功能之强大,然后想做一个东西练练手,碰上了这个问题,对于一幅图片来说,如何识别其中的道路以及边界线,并计算出偏离方向,之前试过霍夫变换,但是图片除了道路之外的障碍有点多,而且边缘检测的也不均匀,不知道如何计算道路的偏离中心的角度,还请各位大神教一下过程,感激不尽,[img=https://img-bbs.csdn.net/upload/201609/07/1473243916_192400.png][/img]
python--识别图片中的文字
本篇文章主要参考了 python图像处理之识别图像中的文字 这篇文章,在实现的过程中出现了些偏差,特此记录。因为此时笔者不是第一次安装,所展示的结果会和首次安装的结果有所差别。 1.安装PIL 以管理员的身份打开命令提示符,输入:pip install pillow. (注:PIL是python平台事实上的图像处理标准库,但PIL仅支持到python2.7,加上年久失修,于是在PIL的基础上...
如何识别rtf中的图片
数据库中将存放以rtf中的内容是text形式,除了字符串以外,图片是如何进行区别的?
识别二维码图片中 的二维码
使用Zxing来识别二维码, 但为提高二维码识别成功率,  找出大致二维码所在区域生成图片, 再进行扫描,  亲测10张均可识别出来 using System.Drawing; using System.IO; using ZXing; foreach (FileInfo file in folder.GetFiles("*.jpg")) {
TF.js 识别图片中的物件
通过 tensorflow.js 的 coco-ssd 项目修改得到图片物件识别小 DEMO,支持自己添加本地图片进行识别,不涉及到训练库,只是纯前端项目,需要梯子拉取训练集。 线上体验 static.chenng.cn/tfjs-coco-s… Github 仓库 github.com/ringcrl/tfj… 本地调试 # 克隆项目 git clone https://github.com/...
机器学习之KNN识别验证码
https://mp.csdn.net/mdeditor/85250661 使用Knn完成验证码识别,环境是python3+jupyter notebook。做完这个就会对knn有深入的理解
机器学习硬币面额识别
本项目是用matlab实现的基于机器视觉的硬币面额识别系统
机器学习-金融风险识别代码
机器学习-金融风险识别代码,里面有代码可学习金融风险等模型
S3C2410硬件手册上的重要部分
中文说明,S3C2410硬件手册上的重要部分
概述机器学习在流量识别中的应用
比较全面的介绍了概述机器学习在流量识别中的应用 方面的知识。
有关软件工程的一些重要部分
软件工程相关的知识 对于学习软件工程应该有帮助
针对shell部分重要部分
1.shell的种类 vi /etc/shells /bin/sh /bin/bash /sbin/nologin /bin/tcsh /bin/csh /bin/ksh 2、最常见的shell是Bash,linux默认的shell 例、vi frist_shell.sh     #!/bin/bash--使用的是什么脚本     #This is my first shel
s3c2440中文手册(重要部分)
s3c2440中文手册 注:本资源只有英语手册的一部分一共15章。
OpenCVforUnity中识别图片中的基础图形
本文主要介绍了基于OpenCV识别圆形、正方形、长方形和三角形等基础图形的功能 图片导入 场景中创建RawImage组件,用来展示图片,创建PatternRecognation空物体,空物体上挂载新脚本shapeDectedScript.cs public RawImage Pic; //UI private Mat scrMat; //Mat格式存放处理的图片 //读取图片 scrMat ...
vba中如何识别word2000中的图片
word2000中将节、段落、句子等识别为特定的对象(Sections,Paragraphs, Sentences),请问Word2000中怎样表示一个图片
python基础-python中的四个重要部分
编程的目的: 编写一个程序,使运行他的终端设备为我们做特定的事 编程语言和人类语言的不同之处 编程语言是精确的 编程语言的每一句话都有目的性 python的四个重要的部分 数据 数据是程序运行的原料,数据可以来自于程序,也可以来自于用户 数据有着不同的数据类型,不同的数据类型在不同的场合使用。不同的数据类型无法进行合并,但是可以相互转换 函数 ...
机器学习: TensorFlow with MLP 笑脸识别
Tensor Flow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。 这是谷歌开源的一个强大的做深度学习的软件库,提供了C++ 和 Python 接口,下面给出用Tensor Flow 建立MLP 网络做...
相关热词 c#入门推荐书 c# 解码海康数据流 c# xml的遍历循环 c# 取 查看源码没有的 c#解决高并发 委托 c#日期转化为字符串 c# 显示问号 c# 字典对象池 c#5.0 安装程序 c# 分页算法

相似问题

0
机器学习 + Opencv 的图像识别 (Android平台)
1
python+机器学习情感分析:为什么取高信息量特征之后,算法的准确率反而比没取之前的低?
1
行为识别,iDT算法Fishervector编码(DTFV)后的工作遇到了疑问
2
在hadoop上用mahout的随机森林算法训练机器学习分类器
6
机器学习的模型文件怎么理解,谁能解答一下
1
机器学习knn算法中目标变量转换为factor
3
关于机器学习中的交叉验证,有一个问题向问问大家?
2
机器学习实战第8章交叉验证岭回归对标准化后数据还原数据还原的
2
新人 人脸识别 python opencv.深度学习 有一些概念性问题 求助一下
1
哪些机器学习算法可以估计参数呢?
0
细胞自动机可以和哪些机器学习算法结合使用?
1
机器学习中分类器验证AUC值不理想,能否比较验证集实际频率和预测概率均值来说明模型准确性。
2
机器学习为什么熵可以衡量数据集划分的优劣?
1
怎么对机器学习后的的acc和epoch进行绘图啊
2
数据分析数据结构,有没有相关的机器学习算法? 急求大神指点
0
Viola-Jones算法用自己拍的照片当数据集,正负图像要不要求角度和构图一致,只是识别物存在与否的区别?
1
有没有一种机器学习算法能够从几组数据中直接输出第几组数据是最优的?
0
python 机器学习“local variable 'clf' referenced before assignment”。尝试过全局变量的方法。
1
图像处理中,每次识别一个汉字,汉字位置及角度随意放置,要求识别出相关汉字及其角度
0
已知:4张散点图及其坐标,并且第5张散点图走势由之前4张图的部分走势拼接而成。