OpenCV SIFT特征转换为LSH（局部敏感哈希）

OPENCV SIFT提取出来的特征维度太高，特征点数目也过多，我需要把它进行二值化，百度一波后感觉LSH可能是一个比较好的方法。但是本人在这方面纯属小白，求一份OpenCV SIFT特征转换为LSH（局部敏感哈希）的代码，最好是java的，C++的话也是可以的，不胜感激！！！
邮箱：891918144@qq.com

写回答
好问题 2 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ttbb2016789 2017-12-07 22:34
关注
—算法原理是很重要，如何运用的思考过程，也是值钱的嘛---

大约是2-3年前，手头有个项目是图形检索。就是输入一张图，找出一张最近似的图片。就是现在各种APP和搜索引擎上常见的拍照之后直接搜索信息和商品的功能。两者的原理是完全一样的。我的项目规模不大，设计要求是单服务器，图库大小是10万张，检索时间不能大于2秒时间。这个设计要求，最难的地方有两点，第一，更新图库的时候如何快速刷新现有图像特征数据库。第二，则是降低匹配时间。

一般来说，图像特征匹配算法常用的有SURF和SIFT，两种取的图像特征维度是不同的。SURF是64维，SIFT则是128维。从代码的角度，64维可以理解为有个变量是数组，数组的长度是64。128维就是数组长度是128.我在项目中采取的试SURF算法。图像特征点依据参数不同，一张图会在500-1000左右游走。按最低的500来计算，10万张图的总特征点数量是5000万个。

于是最终图像检索的问题就转换成：从5000万个64维的特征点中找到和用户输入的图所包含的大约500-1000个特征点，距离最近的一组特征点，并判断这组特征点归属图库中的那些图片，命中率又是多少？

因为求的是最近距离，所以每两个点之间都要计算距离。如果算法不做优化，那么查询一次，就需要在64维坐标系中最少计算250亿次两点间距离。时间要求在2秒之内，想想都可怕。而且SURF的特征值都是浮点数。

2维算距离的公式大家都学过，(x1-x2)的平方+(y1-y2)的平方，再开方，就能得出两点之间的距离值。64维，依次类推就行。大量的数据计算过程中，有大量的平方和开方，基本上就是性能黑洞。我项目本身也只能是单服务器，试图通过提升硬件来扩容计算量，是行不通的。

所以整体项目设计最终演化成一个问题：如何降低运算量。

一切性能优化的问题，最后也是“如何降低运算量”。在这个项目中，我查询了大量资料之后，采用了一些方法来降低单次运算量，比如分组，比如降维。

降维的方法，论文库中搜索下，很多，各种方案都有。因为项目本身的要求就是要快速计算。那么对降维方法的基本要求是，第一快速运算，第二，运算必需有唯一结果。

快速运算这个要求就略过不说了。LSH的运算速度已经足够快了。运算结果唯一性是非常重要的一条要求。结果唯一，就可以进行预先运算，运算结果可以永久保存，超多方便之处。而且从运算量的角度来说，判断是否相等，也比其他的运算符要快很多。

看了不少论文之后，最终选择的降维方法是LSH，就是局部敏感哈希算法。（对算法本身有兴趣的，请自行搜索资料）。LSH代码量很小，核心也就是几行代码，改写成任何一种语言都很方便。严格来说，我选中的是Locality-Sensitive Hashing Scheme Based on p-Stable Distributions。源代码参考是LSHBOX。

实际上LSH每次全新计算结果并不唯一，好在这个算法有一套随机数可以事先生成之后固定下来。这样可以让SURF特征点，无论什么时候输入，输出结果都是一样的。最终64维的浮点数全部降维到10维，转换为整数。计算量降低了好几个量级。降低到10维是反复测试之后的结果。降太低，会有大量的高维点映射到低维数据上，最终的运算量完全没降下来，就失去了降维的意义了。

最终通过LSH，把图库中的全部特征点降维之后，再结合一些其他的办法，磕磕绊绊的把项目做完了。问最终应用结果？勉强能符合设计要求

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

编辑

预览

报告相同问题？

关注问题

opencv sift 新人的问题 opencv
2016-02-16 22:12

回答 1 已采纳你这个是要干嘛？我看你是用一个小图片中的特征去在大图片里面找，找到之后做一个包围盒？那你应该把不太对的特征点筛选完后在画包围盒还是你就是要找轮廓？
#opencv数据类型转换#
2018-05-03 23:47

回答 1 已采纳 matrix和mat 转换 https://blog.csdn.net/yangliuqing19/article/details/60874290 Mat和Image转换 https://bl
OpenCV色彩空间转换 opencv
2022-11-28 14:48

回答 1 已采纳？你看看你打的什么，人家是cv2.xxx，不是cv.2
图像检索(6)：局部敏感哈希索引(LSH)
2018-10-16 01:51

weixin_33918114的博客以VLAD为例，基于SIFT特征点，设视觉词汇表的大小为256，那么一幅图像编码后的VLAD向量的长度为$128 \times 256 = 32768 $。通常要对编码后的VLAD向量进行降维，降维后的向量长度应该根据图像库中图像量的大小来，...
需要openCV特征提取和匹配指导，具体看内容？
2018-12-04 01:11

回答 2 已采纳路人甲，来冒泡，看到你的问题觉得你应该不是缺一个师傅，而是感觉有点迷茫，找不到方向，你应该买两本数看一下，深入学习后不应该还会有这样的问题。 CSDN上不缺大佬，不过他们都很忙，不会因为一点C币
用opencv把图片转换为灰度图，结果偏绿色 python 开发语言
2020-02-19 08:59

回答 1 已采纳变换没错，显示的命令有问题，plt用来显示三通道的，但是灰度图是单通道的，用plt.imshow(img, plt.cm.gray)，或者用cv2.imshow。
sift特征点模板匹配检测堆叠目标 c++ opencv 计算机视觉
2023-03-29 02:09

回答 3 已采纳这些特征点匹配一般只会匹配一个最佳的结果返回吧，如果你要匹配多个的话，要么for循环，将上一个最佳的匹配mask掉，然后匹配下一个，要么换检测或者专门训练一个网络，将特征接近的全部返回。另外，堆叠这个
OpenCV系列教程四：图像金字塔、特征检测与特征匹配，图像查找、对齐和拼接
2024-10-13 12:26

神洛华的博客 SIFT算法的核心原理可分为四个步骤：特征点检测、特征点定位、主方向确定和特征描述符生成。特征点检测首先，SIFT算法通过构建图像的多尺度金字塔来实现尺度不变性。使用高斯模糊函数对图像进行不同尺度的模糊处理，...
opencv如何将16位深度影像转换为8位深度并显示？ opencv
2017-12-07 05:34

回答 2 已采纳你这样做是不行的，那个只是强制的数值转化，就好一个int 强转为 uchar得到值是一个错误值，你应该把16位的规格化到8位上去，即自己逐像素转换，即像素值 * p。double p = (d
OpenCV 特征匹配关键点连线都是直线 opencv python 计算机视觉
2022-10-25 03:00

回答 1 已采纳 1.确保特征检测的两幅图像尺寸一致2.提取特征点后进行匹配算法，可通过暴力匹配、最近邻KNN匹配进行特征点分类，可通过调节最小距离进行优化分组3.如想达到更好的匹配效果，可先通过随机采样一直法RANS
sift特征点匹配筛选问题 opencv
2016-02-18 21:26

回答 2 已采纳 [OpenCV特征点检测增加包围盒](http://blog.csdn.net/wangyaninglm/article/details/50732434 "") 上一个答案怎么好像插入到代码里
opencv-python 详解图像特征（三）
2021-09-05 02:18

RayChiu_Labloy的博客 SIFT算法用于检测特征点，SIFT算法对旋转、尺度缩放、亮度变化等保持不变性，对视角变换、仿射变化、噪声也保持一定程度的稳定性，是一种非常优秀的局部特征描述算法。但是其实时性相对不高。SURF(Speeded Up Robust...
LSH︱python实现局部敏感随机投影森林——LSHForest/sklearn（一）
2017-04-19 10:58

悟乙己的博客关于局部敏感哈希算法，之前用R语言实现过，但是由于在R中效能太低，于是放弃用LSH来做相似性检索。学了python发现很多模块都能实现，而且通过随机投影森林让查询数据更快，觉得可以试试大规模应用在数据相似性检索+...
基于哈希感知的图像相似度判断算法
2022-05-07 01:32

总结，基于哈希感知的图像相似度判断算法通过高效地将高维度图像特征转换为低维度哈希码，实现了大规模图像库的快速相似性搜索。在Java中实现这种算法，不仅可以提升处理速度，还便于与其他Java应用集成，为实际问题...
人工智能-项目实践-信息检索-以图搜图检索系统
2024-02-29 03:45

在本项目实践中，我们将探索人工智能领域的一个重要应用——以图搜图检索系统。这个系统的主要目的是通过比较图像的特征来查找相似的图片，它在搜索引擎、社交媒体、电子商务等多个领域都有广泛应用。在这里，我们...
没有解决我的问题, 去提问

悬赏问题

¥50 代码还没怎么运行但是需要代码功能调用数据
¥15 vue请求不到数据，返回状态200，数据为html
¥15 访问url时不会自动调用其 Servlet的doGet()
¥15 用白鹭引擎开发棋牌游戏的前端为什么这么难找
¥35 哪位专业人士知道这是什么原件吗？哪里可以买到?
¥15 关于#c##的问题：treenode反序列化后获取不到上一节点和下一节点，Fullpath和Handle报错
¥15 一部手机能否同时用不同的app进入不同的直播间？
¥20 输入import torch显示Intel MKL FATAL ERROR，系统驱动1%，: Cannot load mkl_intel_thread.dll.
¥15 点云密度大则包围盒小
¥15 nginx使用nfs进行服务器的数据共享

OpenCV SIFT特征转换为LSH（局部敏感哈希）

2条回答 默认 最新

悬赏问题

2条回答默认最新