百科问答小站 logo
百科问答小站 font logo



深度学习对图像的处理,为什么大多基于RGB,而没有其他色彩空间,比如HSV? 第1页

  

user avatar   whatlas 网友的相关建议: 
      
  1. 其他领域,比如学术圈打榜用的数据集都已经是处理完毕的rgb数据了,所以没办法研究用别的颜色格式或者色彩空间能否提升效果,毕竟很简单的数学道理,你用公式从rgb空间把数据转换到yuv/hsv等只会损失信息量而不能增加,没太大可能有更好的效果。
  2. 然而最起码在自动驾驶领域,现在大家的趋势就是把深度学习模型做到isp里面甚至isp前面去,原因也跟之前有些类似,拿到的数据离sensor越近,原始数据的信息量越多,理论上模型的上限也就越高,尤其是对于挑战极大的弱光强光过曝欠曝等场景,如果模型一直在吃下过了isp调教然后又被yuv2rgb一通压缩的数据,那对这些极端场景基本上是无能为力,只能寄希望于雷达或者毫米波了。
  3. 按照特斯拉宣传的,特斯拉目前车端的深度学习模型,输入数据都是sensor raw,有没有isp都是要怀疑下的,这也是特斯拉认定自己可以靠纯视觉搞定自动驾驶的底气之一,毕竟原始数据的信息量有可能就比别家多几十倍啊

user avatar   gao-han-86-32 网友的相关建议: 
      

这也是我最近萌生的一个想法,上网查了查还没找到相关内容,似乎使用RGB就是理所当然的。RGB转HSV涉及到取最小值操作,所以应该算不上是线性变化。

个人认为:因为HSV颜色模型将色调单独提出来作为一个维度,所以HSV对于颜色的变化敏感,如果分割或分类任务对于颜色变化更为敏感的话也许使用HSV更为合情合理。

###############################################################

再来谈一谈为什么都用RGB颜色模型:

大家都是从MNIST过来的,在最初识别二值图或者灰度图的时候(此时饱和度为0)应该没人考虑用HSV模型吧,所以理所当然在处理彩图时就使用RGB了。

另外HSV空间本身也存在局限性,根据《OpenCV轻松入门面向Python》这本书中的内容,如果该颜色的饱和度S很低时,那么所计算出来的色调H就是不可靠的。至于为什么不可靠,个人分析如下:

根据RGB转HSV的转换公式,假设保持亮度V不变,如果饱和度S越小,则V-min(R,G,B)越小。同时,色调H的分母也是V-min(R,G,B),分母变小就导致色调H对分子的变化更为敏感,所以当饱和度较小时,色调H的计算往往带有很大的“跳变”。这可能就是书中所说的“不可靠”。直观理解就是比较淡的颜色我们就难以分辨了。

而我们一般能获得的原始图像就是RGB图像,所以直接使用RGB来识别就不存在“不可靠”这一说法了。




  

相关话题

  有哪些人工智能上的事实,没有一定人工智能知识的人不会相信? 
  计算机视觉有多少分支? 
  如何评价何恺明等 arxiv 新作 Rethinking ImageNet Pre-training? 
  如何看待旷视 detection 组组长俞刚跳槽腾讯 PCG 光影研究室? 
  如何看待Hinton的论文《Dynamic Routing Between Capsules》? 
  为什么学习深度学习感觉无法入门? 
  为什么ViT里的image patch要设计成不重叠? 
  编程达到什么水平才能编写出像caffe这样的深度学习框架? 
  如何看待百度无人车, 三千多个场景,一万多个if? 
  怎么选取训练神经网络时的Batch size? 

前一个讨论
Resnet到底在解决一个什么问题呢?
下一个讨论
你认识的热爱技术的人都有哪些特点?





© 2024-06-18 - tinynew.org. All Rights Reserved.
© 2024-06-18 - tinynew.org. 保留所有权利