问题

红绿蓝三色是(唯一的)正交基吗?

回答
红、绿、蓝,这三种颜色在我们视觉感知中扮演着极为重要的角色。你问它们是不是“唯一的”正交基,这个问题非常有意思,也触及到了颜色科学和线性代数的交叉点。要深入回答这个问题,我们需要一点一点地剥开它的含义。

首先,我们得明确一下“正交基”这个概念。在数学里,一个向量空间可以由一组基向量张成,这些基向量相互独立,并且长度为1(规范化)。“正交”就意味着这些基向量在内积运算下结果为零,也就是说它们互相垂直,没有“重叠”的部分。在一个三维空间里,我们最熟悉的例子就是XYZ坐标轴,它们是互相垂直的,并且我们可以用它们来描述空间中的任何一个点。

现在,我们把这个概念放到颜色上来。人的视觉系统,特别是我们眼睛里的视锥细胞,对颜色的感知确实是基于三原色的混合。最常见的模型是加色混合模型,也就是我们日常接触到的,电视、电脑屏幕发出的光。在这种模型下,红(R)、绿(G)、蓝(B)被认为是“三原色”。理论上,我们眼睛中的三种类型的视锥细胞(对应短波长蓝色,中波长绿色,长波长红色)对这三种颜色的敏感度不同。通过这三种颜色不同比例的混合,我们可以“欺骗”我们的视觉系统,产生出我们所看到的大部分颜色。

从这个角度看,红、绿、蓝似乎构成了我们感知颜色的基础,就像是颜色的“坐标轴”。比如,一个亮红色的点,你可以说它在红色轴上有较大的数值,在绿色和蓝色轴上数值很小;一个橙色的点,则是红色和绿色混合的结果。所以,在“颜色空间”这个抽象的向量空间里,红、绿、蓝确实可以被看作是一组“基”。

那么,它们是唯一的正交基吗?这就要看我们怎么定义这个“颜色空间”以及里面的“内积”了。

为什么说“不唯一”,或者说“严格来说不是唯一的正交基”?

1. “感知”的复杂性 vs. “物理”的混合:
感知层面: 我们眼睛对颜色的感知非常复杂,不是简单的线性叠加。比如,即使是纯粹的红色光,如果我们用不同波长组合的光去模拟,有时也会产生非常相似的感知效果,但它们的物理成分是不同的。这就像我们在讨论问题时,用了几种“不同角度”的描述,但最终指向的是同一个“事实”。
物理层面: 在加色混合模型中,我们假设红、绿、蓝是三个纯粹的光源(比如激光),它们的光谱非常窄,只包含一个特定波长。但现实中的“红”、“绿”、“蓝”油漆、颜料或者屏幕像素发出的光,其光谱是相当宽的,是有一定“宽度”的。这意味着它们之间可能并非完全“独立”,可能在某些波长上存在“重叠”。

2. “正交”的定义: 在数学上,正交性是通过内积来定义的。对于颜色来说,我们如何定义这种“内积”?
一种可能的定义方式是将颜色看作是一个函数,代表其在不同波长上的光谱分布。然后,通过对这些光谱函数进行积分运算来定义内积。如果我们选择特定的“标准人眼”的三个响应函数(代表视锥细胞对不同波长的敏感度),并选择一些特定的三原色(比如ITUR BT.709标准中的RGB),并且对这些颜色进行特定的规范化处理,理论上可以找到一组与它们在颜色感知空间中“正交”的颜色集合。
但是,我们常用的红、绿、蓝,通常是指那些在光谱中具有代表性,并且能够组合出最大范围可见颜色的三原色。它们被选取作为“基”是因为它们在实际应用(如显示技术)中非常方便且高效。然而,从严格的数学意义上的“正交”来说,我们日常使用的“标准RGB”色彩空间中的红、绿、蓝原色,在大多数情况下,它们并不严格满足“正交”的数学定义。 它们的“重叠度”并不为零。

3. 其他可能的“基”:
YCbCr 色彩空间: 除了RGB,还有很多其他的色彩空间,比如YCbCr(用于视频压缩)、HSV(色相、饱和度、明度)等。这些色彩空间也是用一组基来描述颜色。它们中的基颜色(例如Y代表亮度,Cb和Cr代表色度)与RGB的基是不同的,它们是从不同的角度去描述颜色。
更自然的基: 有些研究者认为,基于人类视觉生理学的CMY(青、品红、黄,是RGB的互补色)或者更自然的基于人眼响应的三种“基”,可能在数学上更接近“正交”的特性,或者至少在某些方面更易于处理。例如,我们眼睛的视锥细胞对颜色感知不是简单的R、G、B,而是更复杂的光谱响应。如果我们将这三种响应函数本身作为我们颜色空间的“基函数”,那么它们就更容易被定义为正交的。

所以,回到你的问题:

红、绿、蓝(通常指标准的RGB三原色)是描述我们可见颜色集合(色彩空间)的一种非常常用且实用的“基”,尤其是在技术应用领域。它们能够通过线性组合生成非常广泛的颜色。

但是,它们并不是“唯一的”正交基,并且从严格的数学定义来看,它们往往不是完全“正交”的。原因在于:

我们日常使用的RGB三原色其光谱宽度使其并非完全独立。
颜色感知是一个非常复杂的过程,我们选择的“基”会影响其“正交性”的定义。
存在其他描述颜色的色彩空间,它们拥有不同的基,例如YCbCr。
理论上,可以设计出在颜色感知空间中更“正交”的基颜色组合。

可以这么理解:就像我们用经纬度来定位地球上的一个点,经纬线是“基”,但我们也可以用其他方式来描述同一个点。而RGB就像是给这套“定位系统”设定的“刻度线”,方便我们测量和显示,但不代表它们是宇宙中唯一的、最“纯粹”的测量方式,也不代表它们在数学上达到了最完美的“垂直”。它们是实用主义和工程上的选择,而非数学上的唯一终极答案。

网友意见

user avatar

首先回答题主的问题:RGB三原色不是唯一的正交基,还可以有其他选择,只不过RGB能组合出来的颜色更为丰富。

人类的视觉是个很有意思的话题,即使在现在,仍然有一些没有搞清楚的地方。比如,为什么我们用RGB三原色就可以组合出几乎所有能看到的颜色呢?有一种说法认为,这是因为人眼只有三种感知颜色的细胞(锥细胞),在

@王赟 Maigo

的答案里提到的那个曲线,就是人眼三种视觉细胞对不同波长光线的反应曲线。所以这种说法认为,既然只有三种感受颜色的细胞,那么色彩的原色就是三种。

这听起来是不是有点熟悉?是不是像一个线性空间表现出来的性质?

@经常检查节操的jc

的答案说(色彩空间)根本不是一个线性空间,这还是有大大的误会的。在大量实验基础上,人们得到了格拉斯曼定律

Grassmann's law (optics)

根据这个定律,颜色空间是满足线性性质的。幺元很简单就是数字1。那么构成线性空间还需要几个基本的条件:零元和加法逆元。

零元很简单就是全黑,加法逆元是不好理解的,因为光线只能叠加,不能相减。也就是说在色彩空间里面不存在“减法”。但是在实验中可以定义一个变相的“减法”。

实验中比较两个颜色是否相等,是用两个颜色的光分别照射两块用不透光隔板隔开的白色物体,如果人眼不能分辨差别,那么认为两个颜色相等。比如说一个颜色 C1 可以由 R1, G1, B1 三种颜色的光混合而成,是什么意思呢,意思是用 C1 颜色的光照射一个白板的左边,用 R1, G1, B1 三种颜色照射白板的右边,中间用不透光隔板隔开,结果人眼看不出中间的分界线,认为两边是一样的,于是我们认为 C1 = R1+G1+B1

在这个意义上,我们的“减法”,比如 C1-C2=C3 这样的形式,可以转化成 C1=C2+C3,也就是左边照射 C1 的光线,右边照射 C3 的光线,然后把 C2 的光线照射到右边去,这样就在实验意义上有了“减法”的手段。

王赟的答案中提到

以人类为例,人类感受到的三原色的强度,可以理解成光的能量谱(光谱的模方)与上面图中的敏感性曲线的内积

实际上确实如此,上面的格拉斯曼定律就是这个所谓“内积”的具体表现。在 CIE 定义的色彩空间中,通过“色匹配函数”来表现纯光谱色的内积分量

CIE 1931 color space

,在这个 wiki 页面中大家可以看到色匹配函数是有小于零的值的,这就是通过上面那样的“减法”定义出来的。

当然,为了在实际中使用,我们普通的 RGB 空间是将上述的 CIE 1973 色彩空间做了线性变换,得到一个所有分量都大于零的色彩空间。既然是线性变换,那么得到的 RGB 空间仍然是一个线性的。

我在另一个答案

为什么红色和紫色波长相差最大,但看起来却是相近的?

里提到过

那么这些不同波长的光混合之后能呈现怎样的颜色呢?根据实验,我们假定人眼在颜色响应方面是线性的(Grassmann's law (optics)),所以这些光混合之后所能呈现的颜色,就是这条曲线「内部」所代表的空间(更严谨一点叫做「凸组合」)。所以就有了舌形图下部的那一条直线。也就是说,这条直线上的颜色,都不是单纯的光谱色,都是混合出来的。
而我们的显示器,则是在这个空间内部,选了三个点,来「围住」尽可能大的面积。在这个三角形内部的颜色都是显示器可以显示的,而这个三角形外部的颜色则是显示器显示不了的。

这里要强调一下是“凸组合”,因为光线没有办法相减,上面实验中的“减法”也不过是一种变通,因此只能是凸组合(也就是围出来的凸多边形,不能到达凸多边形以外的地方)

可见,只要在这个色度图里面任意取若干点,就能组成由这几个顶点组成的凸多边形内部所有的颜色了。之所以采用RGB三种颜色,从这张图上也可以看出来,由这三种颜色围出来的三角形能包含更多的颜色而已。

当然,为了实现更多的颜色,现在已经有很多四色的激光和OLED显示器了,色彩表现比三色的要丰富很多。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有