刘虾 2025-08-06 10:30 采纳率: 49.4%

已结题

视觉检测中怎么将两张图片判断是同一张图片

使用python语言，视觉检测中怎么将两张图片判断是同一张图片，两张图片存在光照变化，位置变化（上下左右移动几十个像素），其实是同一张图片

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

檀越@新空间 2025-08-06 10:31

关注

上午好☀️☀️☀️️
本答案参考通义千问

在视觉检测中，判断两张图片是否为同一张图片（即使存在光照变化、**位置变化（上下左右移动几十个像素）**等），可以采用以下几种方法。以下是详细的解决方案：

一、使用图像相似度算法

1. SSIM（结构相似性指数）

原理：SSIM 是一种衡量两幅图像在亮度、对比度和结构上相似性的指标。
优点：对光照变化和轻微位移有较好的鲁棒性。
缺点：对于大范围的位移或旋转不敏感。

from skimage.metrics import structural_similarity as ssim
import cv2

def compare_images_ssim(img1_path, img2_path):
    # 读取图像并转换为灰度图
    img1 = cv2.imread(img1_path, 0)
    img2 = cv2.imread(img2_path, 0)

    # 计算 SSIM
    score, _ = ssim(img1, img2, full=True)
    return score

重点：ssim 函数返回的是一个介于 -1 到 1 的值，越接近 1 表示越相似。

二、使用特征点匹配（如 SIFT、SURF、ORB）

2. SIFT / SURF / ORB 特征提取与匹配

原理：通过提取图像中的关键点和描述符，然后进行匹配。
优点：对光照变化、平移、旋转都有一定鲁棒性。
缺点：计算量较大，但适用于大多数情况。

import cv2

def match_features(img1_path, img2_path):
    # 读取图像
    img1 = cv2.imread(img1_path)
    img2 = cv2.imread(img2_path)

    # 转换为灰度图
    gray1 = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY)
    gray2 = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY)

    # 使用 ORB 特征提取器
    orb = cv2.ORB_create()

    # 找到关键点和描述符
    kp1, des1 = orb.detectAndCompute(gray1, None)
    kp2, des2 = orb.detectAndCompute(gray2, None)

    # 使用 BFMatcher 进行匹配
    bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
    matches = bf.match(des1, des2)

    # 按距离排序
    matches = sorted(matches, key=lambda x: x.distance)

    # 绘制匹配结果
    matched_img = cv2.drawMatches(img1, kp1, img2, kp2, matches[:50], None, flags=2)
    cv2.imshow("Matches", matched_img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

    # 返回匹配数量
    return len(matches)

重点：len(matches) 越多，说明图像越相似。

三、使用深度学习模型（如 CNN 或 Siamese Network）

3. 使用预训练的 CNN 提取特征

原理：使用预训练的卷积神经网络（如 VGG、ResNet）提取图像特征，再比较特征向量之间的相似度。
优点：对光照变化、位置偏移具有较强鲁棒性。
缺点：需要一定的 GPU 算力支持。

import torch
import torchvision.models as models
import torchvision.transforms as transforms
from PIL import Image

# 加载预训练的 ResNet18 模型
model = models.resnet18(pretrained=True)
model.eval()
model = torch.nn.Sequential(*list(model.children())[:-1])  # 去掉最后的全连接层

# 图像预处理
transform = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])

def extract_features(image_path):
    image = Image.open(image_path)
    image = transform(image).unsqueeze(0)  # 添加 batch 维度
    with torch.no_grad():
        features = model(image)
    return features.squeeze().numpy()

def compare_images_cnn(img1_path, img2_path):
    feat1 = extract_features(img1_path)
    feat2 = extract_features(img2_path)

    # 使用余弦相似度
    similarity = 1 - (feat1 @ feat2.T) / (np.linalg.norm(feat1) * np.linalg.norm(feat2))
    return similarity

重点：cosine similarity 越接近 1，表示两张图片越相似。

四、结合上述方法（推荐方案）

4. 综合方案：使用特征匹配 + 相似度评分

def is_same_image(img1_path, img2_path, threshold=0.9):
    # 使用 SSIM
    ssim_score = compare_images_ssim(img1_path, img2_path)
    
    # 使用特征匹配
    match_count = match_features(img1_path, img2_path)
    
    # 使用 CNN 特征相似度
    cnn_score = compare_images_cnn(img1_path, img2_path)

    # 综合判断
    if ssim_score > threshold and match_count > 50 and cnn_score > 0.9:
        return True
    else:
        return False

重点：设置合理的阈值（如 threshold=0.9）来判断是否为同一张图片。

五、总结（有序列表）

使用 SSIM：评估图像结构相似性，适合光照变化和轻微位移。
使用特征点匹配（如 ORB）：通过关键点匹配判断图像是否为同一张。
使用深度学习模型（CNN）：提取高维特征，增强鲁棒性。
综合方案：结合多种方法，提高判断准确率。
设置合理阈值：根据实际应用场景调整判断标准。

如果你有具体图片或场景，我可以进一步优化代码或建议更合适的算法。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

C#比较图片相似度，两张图片有多少相似
2021-12-02 10:17

本篇将深入探讨如何使用C#来评估和比较两张图片的相似度。首先，我们需要理解图片相似度的概念。在数字图像处理中，相似度通常通过计算两个图像之间的距离或相关性来衡量。这涉及到像素级别的比较、特征检测以及...
Python3实现取图片中特定的像素替换指定的颜色示例
2020-09-19 16:37

Python 作为一种强大的编程语言，提供了丰富的库来支持图像处理任务。其中，PIL（Python Imaging Library，Python图像处理库）是进行此类操作的常用工具之一。本文将详细介绍如何使用 Python3 和 PIL 库来实现取...
毕业设计：基于深度学习的FaceNet算法，对人脸特征进行提取，判断是否输入同一张人脸.zip
2023-10-23 09:26

FaceNet是一种创新的深度学习模型，它通过学习人脸的内在表示，将不同人脸映射到一个欧几里得空间中，使得同一个人的人脸图像距离近，不同人的人脸图像距离远。这种方法不仅提高了人脸识别的准确性，也简化了后续的...
2025目标检测新方向：弱监督目标检测的最新论文研究与应用
2025-08-16 11:22

xcLeigh的博客 2025目标检测新方向：弱监督目标检测的最新论文研究与应用，人工智能，计算机视觉，大模型，AI，本文聚焦2025年弱监督目标检测新方向，阐述其基础概念，包括弱监督学习定义、标注形式及面临的定位不准等挑战。...
易语言简单对比图片
2020-07-17 09:17

1. **图像读取**：首先，我们需要加载待比较的两张图片到程序中。易语言提供了相应的函数或模块来读取图片文件，如“打开图片”命令，将图片数据加载到内存。 2. **图像预处理**：在对比前，可能需要对图片进行...
Android修行手册-五种比较图片相似或相同
2025-02-07 16:55

芝麻粒儿的博客用途：用于检测和描述图像中的局部特征点，广泛应用于图像匹配、物体识别等领域。原理：通过在不同尺度空间中寻找关键点，并为每个关键点生成一个描述符，该描述符对于旋转、缩放、亮度变化具有鲁棒性。用途：用于...
图片快速分割.rar
2020-04-07 11:52

图片快速分割的主要目标是将一张图像划分为多个有意义的区域，每个区域具有相似的颜色、纹理或亮度特征。这一过程对于图像分析、目标检测、图像识别等应用至关重要。快速分割不仅要求精度，还强调效率，以便处理大量...
万字长文解析：计算机视觉领域的目标检测与图像分割（不断更新）
2024-09-10 10:28

SteveMiller的博客从计算机视觉的工程的角度上来说：目标检测与图像分割可以解决什么问题？（3）. 这两个问题，到底难在哪里？（4）. 在工程上，通过案例学思想：目标检测与图像分割可以用来解决什么问题？以案例说明（1）. 跟Dijango...
计算机视觉新贵：动态视觉Transformer的自适应计算理论与应用案例
2025-08-13 20:48

xcLeigh的博客计算机视觉新贵：动态视觉Transformer的自适应计算理论与应用案例，人工智能，计算机视觉，大模型，AI，本文聚焦动态视觉 Transformer，先介绍其基础概念，包括 Transformer 基本结构与自身定义；再阐述自适应计算...
深度学习与计算机视觉教程(12) | 目标检测 (两阶段,R-CNN系列)（CV通关指南·完结）
2022-06-07 18:04

ShowMeAI的博客本文讲解两阶段（two stage）目标检测的发展史和典型算法：R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN等的算法结构和核心流程【对应 CS231n Lecture 11】
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月6日