百科问答小站 logo
百科问答小站 font logo



深度学习对图像的处理,为什么大多基于RGB,而没有其他色彩空间,比如HSV? 第1页

  

user avatar   whatlas 网友的相关建议: 
      
  1. 其他领域,比如学术圈打榜用的数据集都已经是处理完毕的rgb数据了,所以没办法研究用别的颜色格式或者色彩空间能否提升效果,毕竟很简单的数学道理,你用公式从rgb空间把数据转换到yuv/hsv等只会损失信息量而不能增加,没太大可能有更好的效果。
  2. 然而最起码在自动驾驶领域,现在大家的趋势就是把深度学习模型做到isp里面甚至isp前面去,原因也跟之前有些类似,拿到的数据离sensor越近,原始数据的信息量越多,理论上模型的上限也就越高,尤其是对于挑战极大的弱光强光过曝欠曝等场景,如果模型一直在吃下过了isp调教然后又被yuv2rgb一通压缩的数据,那对这些极端场景基本上是无能为力,只能寄希望于雷达或者毫米波了。
  3. 按照特斯拉宣传的,特斯拉目前车端的深度学习模型,输入数据都是sensor raw,有没有isp都是要怀疑下的,这也是特斯拉认定自己可以靠纯视觉搞定自动驾驶的底气之一,毕竟原始数据的信息量有可能就比别家多几十倍啊

user avatar   gao-han-86-32 网友的相关建议: 
      

这也是我最近萌生的一个想法,上网查了查还没找到相关内容,似乎使用RGB就是理所当然的。RGB转HSV涉及到取最小值操作,所以应该算不上是线性变化。

个人认为:因为HSV颜色模型将色调单独提出来作为一个维度,所以HSV对于颜色的变化敏感,如果分割或分类任务对于颜色变化更为敏感的话也许使用HSV更为合情合理。

###############################################################

再来谈一谈为什么都用RGB颜色模型:

大家都是从MNIST过来的,在最初识别二值图或者灰度图的时候(此时饱和度为0)应该没人考虑用HSV模型吧,所以理所当然在处理彩图时就使用RGB了。

另外HSV空间本身也存在局限性,根据《OpenCV轻松入门面向Python》这本书中的内容,如果该颜色的饱和度S很低时,那么所计算出来的色调H就是不可靠的。至于为什么不可靠,个人分析如下:

根据RGB转HSV的转换公式,假设保持亮度V不变,如果饱和度S越小,则V-min(R,G,B)越小。同时,色调H的分母也是V-min(R,G,B),分母变小就导致色调H对分子的变化更为敏感,所以当饱和度较小时,色调H的计算往往带有很大的“跳变”。这可能就是书中所说的“不可靠”。直观理解就是比较淡的颜色我们就难以分辨了。

而我们一般能获得的原始图像就是RGB图像,所以直接使用RGB来识别就不存在“不可靠”这一说法了。




  

相关话题

  如何看待与评价 AAAI 2022 的录用结果? 
  人工智能 CV 岗位是不是现在供严重大于需? 
  如何看待阿里巴巴提出的 FashionAI 比赛? 
  研一,在学机器学习和深度学习,为什么感觉越学越不会,怎么解决这个问题? 
  目前,人工智能语音在说中文时的语气感觉上还比较机械,怎样使人工智能语音的语气更自然一些? 
  AlphaGo 与李世石的对战会推动人类的极限还是机器学习的进步和觉醒? 
  如何评价MSRA最新的 Relation Networks for Object Detection? 
  如何评价 Face++ 旷视科技最新出品的检测专用 backbone 网络 DetNet ? 
  为什么opencv使用BRG模式读入图像? 
  刚进算法团队,大牛们讨论高深的 cv 术语和算法,如何才能听懂? 

前一个讨论
Resnet到底在解决一个什么问题呢?
下一个讨论
你认识的热爱技术的人都有哪些特点?





© 2025-02-05 - tinynew.org. All Rights Reserved.
© 2025-02-05 - tinynew.org. 保留所有权利