百科问答小站 logo
百科问答小站 font logo



深度学习对图像的处理,为什么大多基于RGB,而没有其他色彩空间,比如HSV? 第1页

  

user avatar   whatlas 网友的相关建议: 
      
  1. 其他领域,比如学术圈打榜用的数据集都已经是处理完毕的rgb数据了,所以没办法研究用别的颜色格式或者色彩空间能否提升效果,毕竟很简单的数学道理,你用公式从rgb空间把数据转换到yuv/hsv等只会损失信息量而不能增加,没太大可能有更好的效果。
  2. 然而最起码在自动驾驶领域,现在大家的趋势就是把深度学习模型做到isp里面甚至isp前面去,原因也跟之前有些类似,拿到的数据离sensor越近,原始数据的信息量越多,理论上模型的上限也就越高,尤其是对于挑战极大的弱光强光过曝欠曝等场景,如果模型一直在吃下过了isp调教然后又被yuv2rgb一通压缩的数据,那对这些极端场景基本上是无能为力,只能寄希望于雷达或者毫米波了。
  3. 按照特斯拉宣传的,特斯拉目前车端的深度学习模型,输入数据都是sensor raw,有没有isp都是要怀疑下的,这也是特斯拉认定自己可以靠纯视觉搞定自动驾驶的底气之一,毕竟原始数据的信息量有可能就比别家多几十倍啊

user avatar   gao-han-86-32 网友的相关建议: 
      

这也是我最近萌生的一个想法,上网查了查还没找到相关内容,似乎使用RGB就是理所当然的。RGB转HSV涉及到取最小值操作,所以应该算不上是线性变化。

个人认为:因为HSV颜色模型将色调单独提出来作为一个维度,所以HSV对于颜色的变化敏感,如果分割或分类任务对于颜色变化更为敏感的话也许使用HSV更为合情合理。

###############################################################

再来谈一谈为什么都用RGB颜色模型:

大家都是从MNIST过来的,在最初识别二值图或者灰度图的时候(此时饱和度为0)应该没人考虑用HSV模型吧,所以理所当然在处理彩图时就使用RGB了。

另外HSV空间本身也存在局限性,根据《OpenCV轻松入门面向Python》这本书中的内容,如果该颜色的饱和度S很低时,那么所计算出来的色调H就是不可靠的。至于为什么不可靠,个人分析如下:

根据RGB转HSV的转换公式,假设保持亮度V不变,如果饱和度S越小,则V-min(R,G,B)越小。同时,色调H的分母也是V-min(R,G,B),分母变小就导致色调H对分子的变化更为敏感,所以当饱和度较小时,色调H的计算往往带有很大的“跳变”。这可能就是书中所说的“不可靠”。直观理解就是比较淡的颜色我们就难以分辨了。

而我们一般能获得的原始图像就是RGB图像,所以直接使用RGB来识别就不存在“不可靠”这一说法了。




  

相关话题

  在做算法工程师的道路上,你掌握了什么概念或技术使你感觉自我提升突飞猛进? 
  有哪些可以自学机器学习、深度学习、人工智能的网站? 
  旷视(Face++)完成C轮1亿美元融资,是否说明旷视已经进入独角兽阵营? 
  如何评价1700亿参数的GPT-3? 
  如何理解深度学习源码里经常出现的logits? 
  如何看待Yoav Goldberg 怒怼来自MILA的GAN for NLG的paper? 
  如何看待谷歌研究人员提出的卷积正则化方法「DropBlock」? 
  Transformer是如何处理可变长度数据的? 
  在推荐系统中,如何较好的采用深度学习方法获取用户长短期兴趣? 
  深度学习到底是「实验科学」还是「理论科学」?能否称为「算法」? 

前一个讨论
Resnet到底在解决一个什么问题呢?
下一个讨论
你认识的热爱技术的人都有哪些特点?





© 2024-11-28 - tinynew.org. All Rights Reserved.
© 2024-11-28 - tinynew.org. 保留所有权利