问题是这样的,在做行为识别中,对提取到的 HOG特征,HOF特征,或者SIFT特征训练码书,用的是VLAD算法。
这是网上搜到的步骤
在第二步中,我将训练集中的特征用K-means 训练完码本之后,应该怎么保存?
训练码本 和 后续的使用码本是不是分开的?(ps:我认为是分开的,或者说我需要分开)
如果说是分开的,将测试集中的特征 根据码本 做 3 步 操作的时候应该怎样操作?
问题是这样的,在做行为识别中,对提取到的 HOG特征,HOF特征,或者SIFT特征训练码书,用的是VLAD算法。
这是网上搜到的步骤
在第二步中,我将训练集中的特征用K-means 训练完码本之后,应该怎么保存?
训练码本 和 后续的使用码本是不是分开的?(ps:我认为是分开的,或者说我需要分开)
如果说是分开的,将测试集中的特征 根据码本 做 3 步 操作的时候应该怎样操作?
保存训练出的码本可以使用文件存储,例如使用 numpy 库存储为 .npy 文件,或者使用 pandas 库存储为 .csv 文件。这样就可以将训练出的码本保存下来,供后续使用。
在后续的使用中,可以读取之前保存的码本,然后对新的查询图像的特征做剩下的步骤,即:
把新的图像的 SIFT 描述子按照最近邻原则分配到码书上;
计算每个聚类中心的残差和;
对这个残差和做 L2 归一化;
将所有的残差和拼接成长向量;
计算长向量和图像库中的每个向量的欧式距离,输出前 5 个最小距离。
假设你已经训练出了一个使用K-means算法的VLAD码书,该码书共有K个聚类中心,每个聚类中心都对应一个128维的向量。你可以使用以下代码将这个码本保存到磁盘上:
import numpy as np
# 聚类中心的数组,shape为K * 128
cluster_centers = ...
# 保存聚类中心到磁盘
np.save("vlad_codebook.npy", cluster_centers)
在后续的使用中,你可以加载这个码书,然后对新的图像中的SIFT描述子进行分配和残差操作,并使用以下代码加载训练好的码书:
import numpy as np
# 加载聚类中心
cluster_centers = np.load("vlad_codebook.npy")
在接下来的操作中,你可以使用这个cluster_centers数组作为码书,进行图像的检索。