计算机视觉频域图展示

论文中给的频域图（DCT）是这样的：

公式1如下：

但我用作者给的代码，生成的图像是这样的：

请问，我要做什么处理，才能变成作者那样的？

作者提供的核心代码如下：

import numpy as np
import torch
from torch import nn
from PIL import Image
import torchvision.transforms.functional as F
import torchvision.utils as vutils
class Filter(nn.Module):
    def __init__(self, size, band_start, band_end, use_learnable=True, norm=False):
        super(Filter, self).__init__()
        self.use_learnable = use_learnable

        self.base = nn.Parameter(torch.tensor(generate_filter(band_start, band_end, size)), requires_grad=False)
        if self.use_learnable:
            # 根据size为每一个坐标位置随机生成数字
            self.learnable = nn.Parameter(torch.randn(size, size), requires_grad=True)
            self.learnable.data.normal_(0., 0.1)
            # Todo
            # self.learnable = nn.Parameter(torch.rand((size, size)) * 0.2 - 0.1, requires_grad=True)

        self.norm = norm
        if norm:
            self.ft_num = nn.Parameter(torch.sum(torch.tensor(generate_filter(band_start, band_end, size))), requires_grad=False)

    def forward(self, x):
        if self.use_learnable:
            filt = self.base + norm_sigma(self.learnable)
        else:
            filt = self.base

        if self.norm:
            y = x * filt / self.ft_num
        else:
            y = x * filt
        return y

# 根据图像的尺寸生成傅里叶矩阵
def DCT_mat(size):
    m = [[ (np.sqrt(1./size) if i == 0 else np.sqrt(2./size)) * np.cos((j + 0.5) * np.pi * i / size) for j in range(size)] for i in range(size)]
    return m
# 尺寸范围内设1，否则设0
def generate_filter(start, end, size):
    return [[0. if i + j > end or i + j <= start else 1. for j in range(size)] for i in range(size)]

# 将值归一化为-1~1
def norm_sigma(x):
    return 2. * torch.sigmoid(x) - 1.

class FAD_Head(nn.Module):
    def __init__(self, size):
        super(FAD_Head, self).__init__()

        # init DCT matrix
        # 生成傅里叶矩阵
        self._DCT_all = nn.Parameter(torch.tensor(DCT_mat(size)).float(), requires_grad=False)
        # 傅里叶矩阵转置
        self._DCT_all_T = nn.Parameter(torch.transpose(torch.tensor(DCT_mat(size)).float(), 0, 1), requires_grad=False)

        # define base filters and learnable
        # 0 - 1/16 || 1/16 - 1/8 || 1/8 - 1 || 0 - 1
        low_filter = Filter(size, 0, size // 16)
        middle_filter = Filter(size, size // 16, size // 8)
        high_filter = Filter(size, size // 8, size)
        all_filter = Filter(size, 0, size)

        self.filters = nn.ModuleList([low_filter, middle_filter, high_filter, all_filter])

    def forward(self, x):
        # DCT  对应论文中公式1
        x_freq = self._DCT_all @ x @ self._DCT_all_T  # [N, 3, 224, 224]
        vutils.save_image(x_freq, "rgb_freq.png")
        # 4 kernel
        y_list = []
        for i in range(4):
            x_pass = self.filters[i](x_freq)  # [N, 3, 224, 224]
            y = self._DCT_all_T @ x_pass @ self._DCT_all  # [N, 3, 224, 224]

            vutils.save_image(y[:,:,:], f"rgb_freq_{i}.png")
            y_list.append(y)
        # 拼接四个可学习的频域图
        out = torch.cat(y_list, dim=1)  # [N, 12, 224, 224]
        return out
if __name__ == '__main__':
    img_path = "2.png"
    rgb = Image.open(img_path).convert("RGB")
    rgb = F.to_tensor(rgb)
    freq = FAD_Head(size=256)
    rgb_freq = freq(rgb)

测试图像：

2.png

PS：谁能帮我用代码解决这个问题，赏金就归谁（按时间顺序的第一个人），谢谢大家！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

14条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2023-11-06 21:11
关注
获得0.45元问题酬金
引自强大而免费的微信小程序：皆我百晓生。

频域图通常是通过对图像进行傅里叶变换来获取的。根据您的描述，您得到的频域图显示了黑底和淡灰色的人脸轮廓，而作者给出的频域图显示了蓝色的明暗人脸形状。

要将您生成的图像变成作者的样式，您可以尝试以下处理步骤：

检查颜色映射：可能是由于不同的颜色映射导致了您得到的淡灰色的图像。尝试使用颜色映射函数将图像映射到更接近蓝色的色彩空间。例如，您可以使用OpenCV中的cv2.applyColorMap()函数来应用颜色映射。

调整亮度和对比度：如果颜色映射没有带来显著改变，您可以尝试调整图像的亮度和对比度。这可以通过线性变换或直方图均衡化来实现。您可以尝试使用OpenCV中的cv2.equalizeHist()函数来进行直方图均衡化。

调整阈值：如果以上步骤都没有带来满意的结果，您可以尝试将图像转化为二值图像。使用阈值分割方法将图像转换为黑白图像，然后将黑色区域转换为蓝色。

请注意，这些步骤是一种尝试和调整的过程，具体应用哪些步骤取决于您的具体情况和要求。另外，您可以尝试查看作者提供的代码和相关论文以获取更多关于频域图生成的具体细节。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

计算机视觉：人工智能的关键技术
2023-12-27 17:58

光子AI的博客 计算机视觉作为人工智能的一个重要分支，已经在多个领域展现出巨大的潜力。从基础的图像处理到复杂的场景理解，从传统的机器学习方法到最新的深度学习技术，计算机视觉正在不断突破技术边界，为我们创造出更智能、更...
计算机视觉特征提取与图像处理总结 计算机视觉.pdf
2022-04-21 12:42

"计算机视觉特征提取与图像处理总结" 计算机视觉特征提取与图像处理是计算机视觉领域中的核心内容，涉及图像处理、特征提取、目标检测、图像分类等方面。下面是计算机视觉特征提取与图像处理的知识点总结：图像...
计算机视觉领域图像去模糊技术作业优化设计
2025-08-21 05:25

计算机视觉领域作为人工智能的一个重要分支，在图像处理中扮演着至关重要的角色。其中，图像去模糊技术一直是研究的热点，其目的是从模糊的图像中恢复出清晰的视觉信息。由于图像模糊可能来源于多种原因，如运动模糊...
计算机视觉基础｜从 OpenCV 到频域分析
2025-02-21 10:39

紫雾凌寒的博客在当今数字化时代，图像处理已渗透到我们生活的方方面面，从日常使用的智能手机拍照美化，到医学领域的精准诊断，再到自动驾驶中的环境感知，其重要性不言而喻。在图像处理领域中，OpenCV 和频域分析，成为众多...
2021-06-18计算机视觉整理 计算机视觉.pdf
2022-04-21 13:45

计算机视觉基础知识点总结 计算机视觉是交叉学科，涉及计算机科学、数学、物理、生物学和工程学等领域。它主要研究如何使计算机能够像人类一样看懂和理解图像信息。图像定义 * 图像定义：用各种观测系统以不同...
计算机视觉要用到的书籍（英语） 计算机视觉.pdf
2022-04-21 11:52

计算机视觉是信息技术领域的一个关键分支，它涉及到图像的获取、处理、分析以及理解。这个领域融合了多种学科，包括数学、...学习这些内容不仅可以提升对图像的理解，也能为开发更智能的计算机视觉系统打下坚实基础。
计算机视觉任务中数字图像处理的频率域和空间域
2024-09-05 16:04

程序员非鱼的博客在计算机视觉任务中，频率域和空间域是处理图像和分析图像特征的两种不同的视角或域。在深度学习领域中，我们可以根据特定任务的需求，选择合适的域（空间域/频率域）来对图像进行处理以取得我们想要的结果。
【计算机视觉】计算机视觉课程要点总结
2025-12-17 23:47

roman_日积跬步-终至千里的博客【计算机视觉】计算机视觉课程要点总结
计算机视觉中的目标检测技术详解
2024-12-03 14:16

瑕疵的博客与单纯的图像分类不同，目标检测不仅需要确定图片中存在哪些类别的物体，还需要精确地定位每个物体的位置。SSD是一种单阶段目标检测器，它直接从不同尺度的特征图上产生固定数量的候选框，并对每个候选框进行分类和...
AI应用：计算机视觉相关技术总结
2025-06-14 08:37

路溪非溪的博客 计算机视觉通过融合传统算法与深度学习，从基础的图像特征提取发展到复杂的...未来，随着大模型、多模态技术的发展，计算机视觉将向更智能、更贴近人类认知的方向演进，同时在边缘计算、实时性等领域面临更多工程挑战。
计算机视觉课程第一阶段大型作业
2025-08-20 19:33

计算机视觉作为人工智能的一个重要分支，已经广泛应用于工业检测、医疗成像、智能交通、视频监控、机器人导航等多个领域。对于学生和研究者而言，完成计算机视觉课程的大型作业不仅能够巩固理论知识，而且能够提高...
傅里叶变换：从空域到频域的图像分析【计算机视觉】
2026-03-04 00:08

Sagittarius_A*的博客频域是「特殊工具」：用傅里叶变换拆解频率，精准解决空域搞不定的问题（如周期性噪声），是空域的补充而非替代；数学等价但实现独立：空域卷积 ≈ 频域相乘（卷积定理），但两者无前置依赖，可独立学习、独立使用。...
MATLAB计算机视觉与深度学习实战代码 - 基于小波技术进行图像融合.rar
2024-06-06 10:22

在本资源中，我们主要关注的是使用MATLAB进行计算机视觉和深度学习的实践，特别是基于小波技术的图像融合。小波分析是一种强大的数学工具，它允许我们在时域和频域上同时对信号进行分析，这在处理图像数据时特别有用...
【计算机视觉】图像分割与特征提取——频域增强（低通滤波&高通滤波）
2022-10-10 21:16

赵四司机的博客主要介绍图像频域的概念以及低通滤波以及高通滤波的相关概念
认知科学与人工智能：共同推动计算机视觉的发展
2024-01-09 00:57

光子AI的博客 计算机视觉(Computer Vision)是人工智能领域的一个重要分支，旨在让计算机理解和解释人类世界中的视觉信息。计算机视觉的目标是让计算机能够像人类一样看到、理解和回应图像和视频中的对象、场景和动作。然而，...
时域图片和频域图片
2025-07-18 13:03

古月方yuan的博客特点：直接对应视觉感知，便于理解图像的细节（如物体形状、纹理），但难以直接分析 “变化快慢” 这类规律（例如平滑区域和边缘的差异）图像的亮度（或颜色）随空间坐标（x, y）的变化关系。例如灰度图中，(x,y) 处...
asiftmatlab-[转载]计算机视觉算法与代码集锦 计算机视觉.pdf
2022-04-21 11:52

这篇文档“asiftmatlab-[转载]计算机视觉算法与代码集锦 计算机视觉.pdf”显然是一个综合性的资源，涵盖了多个计算机视觉算法及其MATLAB实现。下面我们将详细探讨其中涉及的一些重要概念和技术。 1. 特征检测与提取...
机器视觉（六）：频域图像增强
2022-12-24 17:54

z530011的博客机器视觉（六）：频域图像增强频域法是在图像的频率变化域中对图像的变换值进行某种运算处理，然后再变回空间域中。同态滤波是一种在频域中同时将图像亮度范围进行压缩和将图像对比度进行增强的方法。
一种基于计算机视觉的物体形状辨别方法.pdf
2022-04-21 11:44

它不仅在技术理论上不断推进人工智能的发展，也为人类社会的各行各业带来了深远的影响。随着技术的不断成熟和优化，我们有理由相信，基于计算机视觉的物体形状辨别方法将在未来发挥更加重要的作用。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 11月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月6日

计算机视觉频域图展示

14条回答 默认 最新

问题事件

14条回答默认最新