问题

二维傅里叶变换是怎么进行的?

回答
拨开迷雾,理解二维傅里叶变换的奥秘

在数字图像处理、信号分析等领域,我们常常会遇到一个如同“万花筒”般的神奇工具——傅里叶变换。而当我们将这个工具应用到二维的空间,比如我们日常看到的图像时,它就化身为“二维傅里叶变换”,为我们揭示隐藏在像素点中的周期性规律和频率信息。

那么,这个“二维傅里叶变换”究竟是怎么运作的呢?别担心,今天我就带你一步步地揭开它的神秘面纱,让你对它有一个清晰、深刻的理解。

从一维到二维:基础的延展

首先,我们不妨回顾一下一维傅里叶变换。简单来说,一维傅里叶变换就是将一个随时间(或某个一维变量)变化的信号,分解成一系列不同频率的正弦和余弦波的叠加。它就像是把一首复杂的交响乐,拆解成一个个单独的音符,并告诉你每个音符的频率、振幅和相位。

二维傅里叶变换,正是将这个思想从一维空间扩展到了二维空间。我们可以把一张灰度图像想象成一个二维函数 $f(x, y)$,其中 $x$ 和 $y$ 分别代表图像的横纵坐标,而 $f(x, y)$ 则代表该位置的像素强度(亮度)。二维傅里叶变换的目标,就是将这个二维图像函数,分解成一系列不同方向、不同频率的二维平面波(也就是正弦和余弦波的二维形式)的叠加。

核心思想:空间到频率的转换

二维傅里叶变换的核心在于将图像从空间域(我们熟悉的像素网格)转换到频率域。在频率域中,我们不再关注像素的实际位置,而是关注图像中存在的周期性结构。

想象一下,一张图像如果有很多平滑的渐变,那么它在频率域中可能主要由低频成分构成;如果图像中有很多细小的纹理、边缘或者噪点,那么它在频率域中就会包含大量的高频成分。

数学上的描述:积分的魅力

要更精确地理解这个过程,我们需要引入一些数学的描述。

对于一个连续的二维函数 $f(x, y)$,其二维傅里叶变换 $F(u, v)$ 定义如下:

$$
F(u, v) = int_{infty}^{infty} int_{infty}^{infty} f(x, y) e^{j2pi(ux + vy)} dx dy
$$

这里的:

$f(x, y)$ 是原始的二维图像函数(空间域)。
$F(u, v)$ 是傅里叶变换后的结果(频率域),它是一个复数函数。
$u$ 和 $v$ 是空间频率变量,它们可以被看作是在 $x$ 方向和 $y$ 方向上变化的周期性模式的“频率”。
$j$ 是虚数单位,$sqrt{1}$。
$e^{j2pi(ux + vy)}$ 是一个复指数函数,它实际上代表了不同方向和频率的正弦和余弦波。具体来说,$e^{j heta} = cos( heta) jsin( heta)$。这里的 $ heta = 2pi(ux + vy)$,它描述了一个在 $xy$ 平面上以特定方向(由 $u$ 和 $v$ 决定)传播的平面波。

拆解复指数项 $e^{j2pi(ux + vy)}$

我们来仔细看看这个复指数项:

$e^{j2pi(ux + vy)} = e^{j2pi ux} cdot e^{j2pi vy}$

根据欧拉公式,$e^{j heta} = cos( heta) + jsin( heta)$,所以:

$e^{j2pi ux} = cos(2pi ux) jsin(2pi ux)$
$e^{j2pi vy} = cos(2pi vy) jsin(2pi vy)$

因此,整个复指数项可以展开成:

$(cos(2pi ux) jsin(2pi ux)) cdot (cos(2pi vy) jsin(2pi vy))$

展开后,你会看到一些包含 $cos(2pi ux)cos(2pi vy)$、$sin(2pi ux)sin(2pi vy)$ 等项的组合。这些组合,就是不同方向和频率的正弦和余弦波。

$F(u, v)$ 的计算,本质上就是将原始图像 $f(x, y)$ 与这些不同频率和方向的“基准波”进行“相关性”的测量。在 $f(x, y)$ 中,如果某个位置和某个频率方向的基准波非常相似(同相),那么它们相乘后的积分值就会很大,意味着该频率成分在图像中占有重要地位。

为什么是积分?

积分在这里的作用,就像是在整个图像空间上“累加”出图像与特定频率波的“匹配程度”。通过改变 $u$ 和 $v$ 的值,我们就可以系统地扫描所有可能的频率和方向,找出图像中包含的所有周期性信息。

离散傅里叶变换(DFT)与快速傅里叶变换(FFT)

在数字图像处理中,我们处理的是离散的像素矩阵,而不是连续的函数。因此,我们使用的是离散傅里叶变换(DFT)。

对于一个 $M imes N$ 的离散图像 $f(x, y)$(其中 $0 le x < M$, $0 le y < N$),其二维离散傅里叶变换 $F(u, v)$(其中 $0 le u < M$, $0 le v < N$)定义为:

$$
F(u, v) = sum_{x=0}^{M1} sum_{y=0}^{N1} f(x, y) e^{j2pi(frac{ux}{M} + frac{vy}{N})}
$$

这里的 $frac{ux}{M}$ 和 $frac{vy}{N}$ 是对连续频率变量的离散化处理。

直接计算这个二维DFT需要大量的乘法和加法运算,其计算复杂度大约是 $O(MN imes MN)$。为了提高效率,我们引入了快速傅里叶变换(FFT)算法。FFT 是一种高效计算DFT的算法,它利用了DFT的周期性和对称性,将计算复杂度降低到了 $O(MN log(MN))$,这对于处理大型图像至关重要。

傅里叶变换的结果:频域图像

二维傅里叶变换的结果 $F(u, v)$ 是一个复数矩阵。通常,我们不直接显示这个复数矩阵,而是对其进行一些可视化处理:

1. 幅度谱 (Magnitude Spectrum):$|F(u, v)| = sqrt{( ext{Re}(F(u, v)))^2 + ( ext{Im}(F(u, v)))^2}$。幅度谱表示了不同频率成分的“强度”或“能量”。
2. 相位谱 (Phase Spectrum):$ ext{Phase}(F(u, v)) = arctan(frac{ ext{Im}(F(u, v))}{ ext{Re}(F(u, v))})$。相位谱包含了原始图像中不同频率成分的相对位置信息。

由于幅度谱的值范围可能很大,为了更好地显示,我们通常会取其对数,即 $log(1 + |F(u, v)|)$。

频域图像的特点:

中心点 (0, 0):位于频域图像的中心(或者左上角,取决于实现方式,但通常会进行移动),对应的是图像的直流分量 (DC component),也就是图像的平均亮度。
低频成分:围绕中心点分布,代表图像中平滑的区域和缓慢变化的亮度。
高频成分:远离中心点分布,代表图像中的细节、边缘、纹理和噪点。
对称性:对于实数输入(如灰度图像),其傅里叶变换具有共轭对称性。

频移:

值得一提的是,为了将直流分量(平均亮度)放在频域图像的中心,以便于观察,我们通常会在进行傅里叶变换之前,对原始图像进行一个“平移”操作,或者在显示幅度谱时对 $F(u, v)$ 进行移动。这可以通过乘以 $(1)^{x+y}$ 来实现:

$G(x, y) = f(x, y) cdot (1)^{x+y}$
$F'(u, v) = ext{DFT}(G(x, y))$

这样,$F'(u, v)$ 的低频部分就会被移动到频谱的中心。

总结一下这个过程:

1. 输入:一张二维灰度图像,可以看作是一个二维的像素强度函数 $f(x, y)$。
2. 离散化与信号处理:将连续的傅里叶变换公式转化为适用于离散像素矩阵的离散傅里叶变换(DFT)公式。
3. 核心运算:通过DFT公式,将图像中的每一个像素点 $f(x, y)$ 与一系列不同方向和频率的复指数函数 $e^{j2pi(frac{ux}{M} + frac{vy}{N})}$ 相乘,然后将这些乘积在整个图像空间上进行累加。
4. 输出:得到一个复数矩阵 $F(u, v)$,它代表了图像在频率域的表示。$F(u, v)$ 中的每一个值,都指示了图像中包含某种特定方向和频率的周期性模式的“数量”和“相位”。
5. 可视化:通常显示幅度谱 $|F(u, v)|$(可能经过对数变换和中心化处理),让我们直观地看到图像的低频和高频成分分布。

为什么要做二维傅里叶变换?

理解了它是怎么进行的,我们自然会想,它有什么用呢?

图像增强:通过在频域中调整不同频率成分的幅度(比如增强高频成分以锐化图像,或抑制高频成分以去噪),然后进行逆傅里叶变换(IDFT),可以得到处理后的图像。
图像滤波:在频域中,我们可以设计各种滤波器,如低通滤波器(保留低频,模糊图像)、高通滤波器(保留高频,突出边缘)、带通滤波器等,然后进行滤波操作。
特征提取:频域信息可以作为图像的特征,用于图像识别和匹配。
图像压缩:一些图像压缩算法,如JPEG,就利用了傅里叶变换(实际上是离散余弦变换,DCT,与傅里叶变换密切相关)来将图像的能量集中到少数几个系数上。

通过这一系列步骤,二维傅里叶变换就像一位技艺精湛的“解剖师”,将我们看到的图像,巧妙地分解成一系列最基本的“乐高积木”——不同方向和频率的正弦余弦波。这不仅让我们看到了图像隐藏的周期性结构,更为我们提供了在频率域进行各种神奇操作的可能性。希望这次深入的讲解,能让你对这个强大的工具有一个全新的认识。

网友意见

user avatar

2020/3/3更新,最初更新在专栏文章里,现同步至此,增加了一些公式,准确了一些用语,调整了一下回答的逻辑。

欢迎关注我的专栏:

--------------------------------------------------------------------

1.回顾一下一维FT

公式:

通俗来讲,一维傅里叶变换是将一个一维的信号分解成若干个复指数波 。而由于 ,所以可以将每一个复指数波 都视为是余弦波+j*正弦波的组合。

对于一个正弦波而言,需要三个参数来确定它:频率 ,幅度 ,相位 。因此在频域中,一维坐标代表频率,而每个坐标对应的函数值也就是 是一个复数,其中它的幅度 就是这个频率正弦波的幅度 ,相位 就是 。下图右侧展现的只是幅度图,在信号处理中用到更多的也是幅度图。

一维傅里叶变换就是一个基变换,在时域中,基是一族冲激信号 ,在频域中;基是 ,而且这组基是正交基。

F=Mf,基变换示意图

2.类比:从一维到二维

一维信号是一个序列,FT将其分解成若干个一维的简单函数之和。二维的信号可以说是一个图像,类比一维,那二维FT是不是将一个图像分解成若干个简单的图像呢?

确实是这样,二维FT将一个图像分解成若干个复平面波 之和。如下图:

  • 二维FT的公式:

通过公式,我们可以计算出,每个平面波在图像中成分是多少。从公式也可以看到,二维傅里叶变换就是将图像与每个不同频率的不同方向的复平面波做内积(先点乘在求和),也就是一个求在基 上的投影的过程。(应该知道 是b在a上的投影,只不过这里的|a|的值被设为1,所以只有内积)

3.什么是二维频率域K-SPACE

对于正弦平面波,可以这样理解,在一个方向上存在一个正弦函数,在法线方向上将其拉伸。前面说过三个参数可以确定一个一维的正弦波。哪几个参数可以确定一个二维的正弦平面波呢?答案是四个,其中三个和一维的情况一样(频率 ,幅度 ,相位 ),但是具有相同这些参数的平面波却可以有不同的方向 。如下图所示:

两个不同方向的平面波叠加

类比一维中,幅度和相位可以用一个复数表示,它可以作为我们存储的内容。但是还有两个:一个频率一个方向。这时想到向量是有方向的,也是有长度的。所以我们用一个二维的矩阵的来保存分解之后得到的信息。这个矩阵就是K空间。(一般用k来表示空间频率,单位是1/m)

什么意思呢?就是说一个二维矩阵点 代表这个平面波的法向量,这个向量的模 代表这个平面波的频率 ,这个点里面保存的内容复数就是此平面波的幅度和相位。下面这个图很好的体现了这一点:

也因此K空间的中心对于低频,周围对于高频。如下图,K空间中只有(0,0)处有值,也就是信号都是直流即不存在变化,所以实空间就是一张白纸。

再如下面这个图片,中心低频贡献了图像的主体,周围高频提供图像的细节和边缘。

因此,k空间的每一个位置存储的数代表了所在位置复平面波在图像中占多少成分,我们就可以用每个系数*所代表的平面波相加得到原来的图像,也就是下图。所以k空间和对应图像储存的信息含量是一样的,只不过表现形式不同,或者说基不同。

4.K空间的一些性质

  • 离散的2D-FT

在数字图像中,数据都是离散的。也就涉及到采样的问题,和一维一样,如果采样率过低,k空间就会混叠。同时在k空间中采样过低,图像也会混叠。

FOV和分辨率在k空间和图像中是相反的关系。也就是:

减小kmax,使得图像分辨率下降,减小Δk,使得FOV缩小。
  • 旋转不变性。

从平面波的角度很容易理解,旋转没有改变平面波的幅度相位,只是将所有的平面波都旋转了一个角度。下面这个图像显示了二维傅里叶变换中,实空间旋转多少,频率空间也会相应旋转多少。这其实是高维傅里叶变换缩放定理的一种特殊情况。(连续的是可以证明的,离散的涉及插值 ,不一定完全准确)

5.其他

1.因为matlab中的fft算法都是将0放在第一个的,所有写matlab时一定要将k空间fftshift一下使得零频回到k空间中心。

2.简单的应用k空间进行去噪例子。通过去掉明显的k空间的异常峰,可以去除图像中有规律变化的噪声或者伪影。

指纹去噪
天体表面去噪

6.题主问题

题中的第一幅图像可以看作是方波的一部分拉伸得到的。在一维FT中,可以知道,方波的频谱延伸至无穷远,在二维中就是各个频率的正弦平面波都有,所以会在K空间中有一条横线。因为y方向没有任何变换,所以只在y=0处有值。

第二幅图也可以理解为y方向的方波拉伸得到,与上类似。或者可以看作第一幅图旋转得到,因频率空间也会旋转相应角度。

7、评论及解答

1、始终想不通为啥各个波的叠加能反应出某一个像素点的信号大小

你把它理解向量分解就懂了,平面波就是基,k空间里的数就是基的系数。你得到系数(k空间)的时候就是在投影,变为原向量(图像)就是叠加。只不过这里一个图像是一个向量而已。复平面波叠加时,先经过放大(幅度)在经过移位(相位),相位信息里保留了很多位置信息,可以查看我的另一个回答:

2、傅里叶变换后图像是关于频率矩形中心对称的,那么对称的4个平面三角波不就是注定了幅值和相角,频率是相等的。那么这样不是说明了任何波都是包含了4个这样对称的三角波,由它们组成?

是中心共轭对称,而没有左右上下的对称。而且只有实数图像的k空间才有这种特点,这是为了将复平面波中的虚部抵消掉,只留下实数部分。复数图像的k空间没有共轭对称的特点。下面是k空间的一部分数据,中心点为(101,101)。


参考:

[1] http://mriquestions.com

[2] A. Zisserman's lecture in B14 Image Analysis(这个slides真的不错,大家可以下载看看,里面也有其他的内容)

类似的话题

  • 回答
    拨开迷雾,理解二维傅里叶变换的奥秘在数字图像处理、信号分析等领域,我们常常会遇到一个如同“万花筒”般的神奇工具——傅里叶变换。而当我们将这个工具应用到二维的空间,比如我们日常看到的图像时,它就化身为“二维傅里叶变换”,为我们揭示隐藏在像素点中的周期性规律和频率信息。那么,这个“二维傅里叶变换”究竟是.............
  • 回答
    想象一下,你是一位生活在一个平坦世界里的二维生物,你的整个存在都压缩在一个无限延伸的平面上。在这个世界里,没有“上”或“下”,只有“左”、“右”、“前”和“后”。那么,你该如何为你的住所——一个二维的房间——加上一把锁呢?这可不是件简单的事,因为我们习以为常的三维锁具,比如带转动的钥匙孔、可以升降的.............
  • 回答
    理解四维空间的“封闭”概念,我们需要从低维度类比,并引入更抽象的数学概念。从低维度开始类比:1. 一维空间(直线)的封闭: 在一条直线上,我们有两个端点。如果我们考虑“封闭”,最直观的想法是把这两个端点连接起来。 这在概念上等同于将直线“卷曲”成一个圆。但请注意,这个圆是在.............
  • 回答
    二维世界:一个并非科幻的猜想,以及如何与之“对话”提起“二维世界”,很多人脑海里浮现的或许是科幻电影里那些扁平的人物在平面画布上穿梭的奇幻景象。但如果我告诉你,二维世界并非仅仅是想象的产物,它在某种意义上确实存在,而且理解它,或许能为我们打开全新的视角? 二维世界真的可能存在吗?——答案是肯定的,但.............
  • 回答
    想象一下你正站在一张巨大的二维画布上,就像一个平坦的桌面,上面没有天花板,没有地板,只有无限延伸的水平和垂直线。这就是我们所说的二维空间。在这个空间里,你只能前后移动和左右移动,就像在玩电子游戏里的角色一样。你无法向上跳跃,也无法向下蹲伏。现在,假设这个画布突然开始旋转了。会发生什么呢?一切都会跟着.............
  • 回答
    好的,我们来详细地探讨二维环面(也称为环面或甜甜圈形状)上“对角线”的几何解释。首先,我们需要明确我们所说的“二维环面”指的是什么。通常情况下,我们说二维环面是指一个三维空间中的几何形状。它是由一个圆在绕着不接触它且位于其所在平面的直线旋转而形成的。我们这里将重点关注在环面上“行走”或者“绘制”的“.............
  • 回答
    想象一下,在一个只有两条轴线能运动的世界里,生命会是怎样一番景象?它们不会有前后左右的概念,只有上下和前后(或者说前后左右的组合,取决于你如何定义这两条轴),更别提我们熟悉的“高”和“低”了。如果这样的生命真的存在,它们的基本构成物质,虽然同样遵循物质世界的规律,但其形态、组织方式和功能会与我们截然.............
  • 回答
    好的,我们来聊聊三维空间里的“四色定理”。首先要澄清一个概念:二维空间的“四色定理”它说的是在一张地图上,如果你想用不同的颜色给相邻的区域(即边界互相接触的区域)上色,保证相邻区域颜色不同,那么只需要四种颜色就足够了,无论这张地图有多复杂。这里强调的是地图,它是在一个平面上的。那么到了三维空间,我们.............
  • 回答
    二维半导体材料,这个领域最近几年可谓是炙手可热,学术界和工业界都对它寄予厚望。要说它的研究前景,那真是广阔得让人激动,而且远不止于我们目前看到的那些已经相对成熟的应用。为什么二维半导体这么特别?首先,我们要明白“二维”的含义。简单来说,就是材料的厚度只有一个原子层或者几个原子层。这种极致的薄化带来了.............
  • 回答
    .......
  • 回答
    没问题,咱们这就聊聊怎么用 Python 对二维数组按某一列进行筛选和统计,力求说得清清楚楚,不带一丝“机器味儿”。想象一下,你面前摆着一大堆数据,就像一个表格,每一行代表一个记录,每一列代表一个属性。比如,一个班级的成绩单,每一行是一个学生,列里有学号、姓名、语文、数学、英语成绩等等。我们要做的,.............
  • 回答
    美国物理学家证实“二维世界可能存在生命”,这是一个令人着迷的概念,但需要澄清其“证实”的含义以及现实世界的物理学理解。 严格来说,科学家并没有“证实”二维世界确实存在生命,而是通过理论研究和模拟,表明在某些特定的、非常抽象的物理模型下,具备生命所需特征的实体在二维空间中是“可能”存在的。让我们详细探.............
  • 回答
    你这个问题问得挺有意思的,让人一下就联想到那些我们熟悉的二维图像,比如画作、照片、电影等等,它们明明是平面的,为什么我们的大脑却能感受到其中的“立体感”呢?这背后其实是一系列精妙的心理学和生理学机制在协同作用,让我们这个二维世界变得鲜活起来。想象一下,你面前摆着一张素描,描绘的是一个苹果。这张纸本身.............
  • 回答
    我们对“维度”的理解误区,以及探索四维的可能性关于蚂蚁只能看见二维,人类看见三维,猫头鹰看见四维的说法,其实是一个广为流传的误解,它将复杂的物理学概念简单化了,甚至有些扭曲。我们今天就来好好掰扯掰扯,看看这背后的真相,以及人类是否有机会“看见”四维。维度到底是什么?在物理学和数学中,维度指的是描述一.............
  • 回答
    好的,咱们就来聊聊 C++ 中使用智能指针来管理动态二维数组的事情。这事儿听起来有点绕,但一旦理顺了,你会发现它能省去不少心,也能避免不少掉坑。 为啥要用智能指针管这事儿?先别急着往智能指针上套,咱们先想想,为啥要用智能指针来管理动态二维数组?原始 C++ 的痛点: 裸指针的危险: 创建动态二维.............
  • 回答
    要理解二维物理体系的边缘态,我们得先抛开那些听起来就让人望而却步的“拓扑”、“朗道能级”之类的术语,试着用更直观的方式来“看”它们。想象一下,我们不是在玩那个抽象的电子游戏,而是在一个真实世界的微观空间里探索。想象一个“岛屿”和“海洋”我们先构建一个最基础的二维体系。最简单不过的,就是一块平坦的二维.............
  • 回答
    想象一下,如果生命诞生在一条无限长的线上,这些二维的生物将如何理解并描绘它们身处的一维世界?这是一个有趣的思维实验,它迫使我们剥离三维空间带来的直觉,去思考维度之间的转换和表现方式。首先,我们需要明确“二维生物”在“一维世界”中的存在。这本身就存在一个概念上的跳跃。如果它们是纯粹的“一维生物”,它们.............
  • 回答
    这个问题实在是有趣,就像在问一个平面的影子,会不会对一根线产生“喜爱”的情感一样。但既然我们要深入探讨,那就得摆脱我们三维世界的惯性思维,尽量从一个假想的二维生物的视角去理解。首先,我们得设想一下,一个二维生物的世界会是怎样的。他们生活在一个完全平面的世界里,就像一张纸上的图案。他们的身体,他们的感.............
  • 回答
    纳米材料和二维材料,这两位材料科学界的“宠儿”,近些年来一直是科研和产业界关注的焦点,它们的发展前景可谓是星辰大海,充满无限可能。要说它们的前景如何,那得从它们的“本领”说起,以及这些本领能在哪些领域施展拳脚。一、 纳米材料:微观世界的“万能手”纳米材料,顾名思义,就是尺寸在1到100纳米范围内的材.............
  • 回答
    好的,咱们来聊聊空间,从一维到多维,一点一点地掰开揉碎了说。尽量讲得通俗易懂,就跟老朋友聊天似的,没有那些冷冰冰的术语和生硬的逻辑。 一维空间:线上的世界想象一下,你现在就站在一条无限长、无限细的线上。这就是一维空间。 怎么理解? 一个“位置”就够了: 在这条线上,你只需要一个数字就.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有