拼接图片边界线过于明显


import pyrealsense2 as rs
import numpy as np
import cv2

class DepthCameraProcessor:
    def __init__(self):
        """初始化深度相机处理器"""
        self.config_camera()
        self.setup_parameters()
        
    def config_camera(self):
        """配置相机参数"""
        self.pipeline = rs.pipeline()
        self.config = rs.config()
        
        # 相机流配置
        self.CAMERA_WIDTH = 640
        self.CAMERA_HEIGHT = 480
        self.DEPTH_STREAM = rs.stream.depth
        self.COLOR_STREAM = rs.stream.color
        self.FORMAT_DEPTH = rs.format.z16
        self.FORMAT_COLOR = rs.format.bgr8
        self.FPS = 30
        
        # 分块参数
        self.NUM_BLOCKS = 10
        
        # 显示参数
        self.WINDOW_COMBINED = 'Binary Blocks Combined'
        self.WINDOW_COLOR = 'Color Image'
        self.EXIT_KEY = ord('q')
        
        # 配置流
        self.config.enable_stream(
            self.DEPTH_STREAM, self.CAMERA_WIDTH, self.CAMERA_HEIGHT, 
            self.FORMAT_DEPTH, self.FPS
        )
        self.config.enable_stream(
            self.COLOR_STREAM, self.CAMERA_WIDTH, self.CAMERA_HEIGHT, 
            self.FORMAT_COLOR, self.FPS
        )
        
    def setup_parameters(self):
        """设置运行时参数"""
        self.profile = None
        self.align = None
        self.running = False
        
    def initialize_camera(self):
        """初始化相机并开始采集"""
        try:
            self.profile = self.pipeline.start(self.config)
            self.align = rs.align(self.COLOR_STREAM)
            self.running = True
            print("相机初始化成功")
            return True
        except Exception as e:
            print(f"相机初始化失败: {e}")
            return False
            
    def stop_camera(self):
        """停止相机"""
        if self.running:
            self.pipeline.stop()
            self.running = False
            print("相机已停止")
            
    def get_frames(self):
        """获取对齐的帧数据"""
        try:
            frames = self.pipeline.wait_for_frames(timeout_ms=5000)
            aligned_frames = self.align.process(frames)
            
            depth_frame = aligned_frames.get_depth_frame()
            color_frame = aligned_frames.get_color_frame()
            
            if not depth_frame or not color_frame:
                return None, None, None
                
            depth_image = np.asanyarray(depth_frame.get_data())
            color_image = np.asanyarray(color_frame.get_data())
            height, width = depth_image.shape[:2]
            
            return depth_image, color_image, (height, width)
            
        except Exception as e:
            print(f"获取帧数据失败: {e}")
            return None, None, None
            
    @staticmethod
    def split_depth_into_blocks(depth_image, num_blocks):
        """将深度图分割成指定数量的块"""
        h, w = depth_image.shape[:2]
        base_block_height = h // num_blocks
        remainder = h % num_blocks
        
        blocks = []
        current_y = 0
        
        for i in range(num_blocks):
            current_block_height = base_block_height + 1 if i < remainder else base_block_height
            start_y = current_y
            end_y = current_y + current_block_height
            current_y = end_y
            
            block = depth_image[start_y:end_y, :]
            blocks.append(block)
            
        return blocks, (h, w)
        
    @staticmethod
    def normalize_depth_blocks(blocks):
        """对深度块进行归一化处理"""
        normalized_blocks = []
        
        for i, block in enumerate(blocks):
            valid_data = block.copy()
            valid_mask = valid_data > 0
            
            if np.any(valid_mask):
                min_val = np.min(valid_data[valid_mask])
                max_val = np.max(valid_data[valid_mask])
                
                # 归一化到 [0, 1]
                normalized_float = (valid_data - min_val) / (max_val - min_val)
                normalized_float = np.clip(normalized_float, 0, 1)
                
                # 转换为 uint8
                normalized_uint8 = (normalized_float * 255).astype(np.uint8)
                normalized_uint8[~valid_mask] = 0
            else:
                min_val = max_val = 0
                normalized_uint8 = np.zeros_like(block, dtype=np.uint8)
                
            normalized_blocks.append(normalized_uint8)
            
            # 打印信息
            info = f"{min_val:.0f}-{max_val:.0f}" if min_val != max_val else "N/A"
            print(f"已归一化 Block {i+1}, 原始深度范围(mm): {info}")
            
        return normalized_blocks
        
    @staticmethod
    def combine_normalized_blocks(normalized_blocks):
        """将归一化后的块组合成完整图像"""
        if not normalized_blocks:
            return None
            
        total_height = sum(block.shape[0] for block in normalized_blocks)
        width = normalized_blocks[0].shape[1]
        
        combined_view = np.zeros((total_height, width), dtype=np.uint8)
        current_y = 0
        
        for block in normalized_blocks:
            h_block = block.shape[0]
            combined_view[current_y:current_y + h_block, :] = block
            current_y += h_block
            
        return combined_view
        
    def display_results(self, combined_view, color_image):
        """显示处理结果"""
        if combined_view is not None:
            cv2.imshow(self.WINDOW_COMBINED, combined_view)
            
        if color_image is not None:
            cv2.imshow(self.WINDOW_COLOR, color_image)
            
    def check_exit_key(self):
        """检查退出按键"""
        key = cv2.waitKey(1) & 0xFF
        return key == self.EXIT_KEY
        
    def run(self):
        """主运行循环"""
        if not self.initialize_camera():
            return
            
        try:
            while self.running:
                # 1. 获取帧数据
                depth_image, color_image, dimensions = self.get_frames()
                if depth_image is None:
                    continue
                    
                # 2. 分割深度图
                blocks, (h, w) = self.split_depth_into_blocks(depth_image, self.NUM_BLOCKS)
                
                # 3. 归一化处理
                normalized_blocks = self.normalize_depth_blocks(blocks)
                
                # 4. 组合结果
                combined_view = self.combine_normalized_blocks(normalized_blocks)
                blurred = cv2.GaussianBlur(combined_view, (5, 5), 0)
                
                # 5. 显示结果
                self.display_results(combined_view, color_image)
                cv2.imshow("GaussianBlur",blurred)
                
                # 6. 检查退出
                if self.check_exit_key():
                    print("检测到退出键，程序结束...")
                    break
                    
        except KeyboardInterrupt:
            print("用户中断程序")
        except Exception as e:
            print(f"运行过程中发生错误: {e}")
        finally:
            self.cleanup()
            
    def cleanup(self):
        """清理资源"""
        print("正在清理资源...")
        self.stop_camera()
        cv2.destroyAllWindows()
        print("程序已安全退出")

def main():
    """主函数"""
    processor = DepthCameraProcessor()
    processor.run()

if __name__ == "__main__":
    main()

拼接图片边界线太明显，想要消除格栅
![img](https://i-blog.csdnimg.cn/ask/b16316423da247cc8ff2bfe213f84d5a.png "#left")

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
紫雾凌寒新星创作者: 人工智能技术领域 2026-01-24 12:37
关注
让 “紫雾凌寒” 来帮你回答,本回答结合 DeepSeek

如果还有问题，请评论或点击头像私信，如果有帮助到您, 请关注、采纳、点赞

问题关键点分析：
- 从提供的代码片段来看，目前代码不完整，仅定义了一个类DepthCameraProcessor，但没有完整的初始化方法及处理拼接图片的相关逻辑。不过可以推测可能是在拼接图片后出现了边界线过于明显的问题。这可能是由于拼接算法、图像预处理等方面的原因导致的。
解决方案：
- 图像融合方法：
可以使用加权融合的方法来减少拼接边界的明显程度。例如，在拼接两张图片img1和img2时，可以按照以下步骤进行：

alpha = 0.5 # 权重，可根据实际情况调整 beta = 1 - alpha img1 = cv2.imread('image1.jpg') img2 = cv2.imread('image2.jpg') # 确保两张图片尺寸相同 height, width = img1.shape[:2] img2 = cv2.resize(img2, (width, height)) dst = cv2.addWeighted(img1, alpha, img2, beta, 0.0)

- 这里通过调整`alpha`和`beta`的值来控制两张图片在融合时的权重占比，从而使拼接边界更平滑。

边缘平滑处理：
在拼接后，可以对拼接区域的边缘进行平滑处理。例如使用高斯模糊：

dst = cv2.GaussianBlur(dst, (5, 5), 0)

- 高斯模糊可以减少图像中的噪声，使边缘看起来更自然，减轻边界线明显的问题。

基于特征的拼接：
如果使用基于特征的拼接方法（如ORB特征点匹配等），可以在匹配后对匹配点进行筛选和优化，然后再进行图像的拼接和融合。

orb = cv2.ORB_create() kp1, des1 = orb.detectAndCompute(img1, None) kp2, des2 = orb.detectAndCompute(img2, None) bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True) matches = bf.match(des1, des2) matches = sorted(matches, key=lambda x: x.distance) good_matches = matches[:min(len(matches), 100)] src_pts = np.float32([kp1[m.queryIdx].pt for m in good_matches]).reshape(-1, 1, 2) dst_pts = np.float32([kp2[m.trainIdx].pt for m in good_matches]).reshape(-1, 1, 2) M, mask = cv2.findHomography(src_pts, dst_pts, cv2.RANSAC, 5.0) warped = cv2.warpPerspective(img2, M, (width, height)) # 融合之前可以对warped进行一些预处理，比如裁剪等 # 然后再进行融合操作

各种方案优缺点：
- 加权融合方法：
优点：简单直观，容易实现，能够在一定程度上控制两张图片的融合效果。
缺点：对于复杂场景的拼接，权重参数需要手动调整，可能无法达到最优效果。
边缘平滑处理：
优点：操作简单，能有效减少边缘的突兀感，使图像整体更平滑。
缺点：过度平滑可能会损失一些图像细节。
基于特征的拼接：
优点：能更准确地找到两张图片的对应关系，拼接效果更自然，适用于各种场景。
缺点：计算量较大，对特征点提取和匹配的算法要求较高，实现相对复杂。

总结：
- 拼接图片边界线过于明显是一个常见问题，可通过多种方法来解决。加权融合、边缘平滑处理和基于特征的拼接各有优缺点。在实际应用中，需要根据具体情况选择合适的方法或综合使用多种方法来达到较好的拼接效果。如果后续代码完整实现了拼接功能，可以根据实际情况进一步优化和调整上述方法的参数。

希望以上解答对您有所帮助。如果您有任何疑问，欢迎在评论区提出。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

VisionPro软件手册+2D拼接+3D扫描+联合编程手册
2025-01-05 10:34

总体而言，VisionPro软件手册是工业视觉领域工作者不可或缺的参考书籍，它不仅包括了VisionPro软件的基本操作指南，还涵盖了2D拼接和3D扫描技术的深入探讨，以及与C#语言结合进行联合编程的实战技巧。该手册集合了...
仓颉编程语言中的列表操作方法：从基础到深度实践
2025-10-29 17:22

Java小大神的博客列表是仓颉编程语言中最常用的动态集合数据结构，它提供了比固定大小数组更强的灵活性，是构建复杂应用的基础工具。与数组的连续内存布局不同，列表通常实现为动态数组或链式结构，支持高效的元素增删和动态扩容。在...
1.rar_二值图像拼接
2022-07-15 10:30

1. 图像读取：使用编程语言如Python的PIL库或OpenCV库，读取每个二值图像文件，将其加载到内存中。 2. 图像预处理：在拼接之前，可能需要对图像进行一些预处理，如调整大小、旋转、裁剪，以确保所有图像在拼接时...
《汇编语言编程基础基于 LoongArch 》读书与实践笔记
2023-02-10 23:35

loongsoner的博客好记性不如烂笔头，在此记录与分享一下《汇编语言编程基础基于 LoongArch 》读书与实践笔记。如文中出现错误，欢迎在评论区留言讨论，我会尽快修改更新 :-)
XGo编程语言：AI原生的多语言融合新星
2024-08-18 10:34

解佳岭Farley的博客 XGo编程语言：AI原生的多语言融合新星【免费下载链接】gop The Go+ programming language is designed for engineering, STEM education, and data science. ...
实现图片全景无缝拼接的软件教程
2025-05-17 19:52

啊湫湫湫丶的博客全景拼接技术是一项将多张图片无缝合成一张宽视角、无接缝的全景图像的技术。它在虚拟现实、影视制作、地图服务等多个领域发挥着关键作用。拼接技术不仅提高了图像质量，还扩展了视觉信息的应用范围，增强了用户体验...
【Go语言学习系列35】数据库编程（二）：ORM技术
2025-03-28 16:05

Gopher部落的博客深入介绍Go语言中的ORM技术，特别是GORM库的使用，包括模型定义、CRUD操作、关联关系处理、事务支持等功能，以及ORM最佳实践与性能优化
AIGC助力小学生编程梦：C++入门不再难！
2024-10-19 18:12

程序边界的博客小学生C 趣味编程从入门到精通》是一本难度适中的小学生编程入门教材。《小学生C 趣味编程从入门到精通》根据小学生学习的特点，选取了 100 多个有趣且易于理解的例子来介绍程序设计的基本概念，让小学生体会到用...
LangFlow能否用于构建AI辅助编程系统？代码生成流水线设计
2025-12-22 08:43

朱昆 iamkun的博客 LangFlow通过可视化方式将自然语言需求转化为可执行代码，降低AI辅助编程系统的开发门槛。它以图形化流程替代传统编码，支持提示工程、上下文检索、代码生成与安全校验的协同设计，提升调试效率与团队协作能力，适合...
活动回顾丨北大/清华/Zilliz/MoonBit共话开源，覆盖视频生成/视觉理解/向量数据库/AI原生编程语言
2025-12-12 13:58

HyperAI超神经的博客无论是视频生成对音画同步的精细化要求、终端侧视觉模型的高效推理优化，还是新一代 AI 原生编程语言的出现，都在推动一个清晰的趋势——产研协同与开源生态，正在成为 AI 时代最关键的创新范式。过去数十年，科研...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月24日

拼接图片边界线过于明显

2条回答 默认 最新

问题事件

2条回答默认最新