百科问答小站 logo
百科问答小站 font logo



有哪些有趣的图形学(CG)和计算机视觉(CV)相结合的应用的例子? 第1页

  

user avatar   li-xiao-yao-67-98 网友的相关建议: 
      

虚拟试衣(Virtual Try-On)就是一个Vision和Graphic相结合的应用。首先,虚拟试衣这个任务的设定基本上是,给定一个人和一件衣服,生成一张图片让这个人穿上这件衣服

对于这个任务,如果想要人的身材和衣服的物理性质被完美模拟的话需要,需要精准用graphic技术对衣服和人进行3D建模。但是考虑到数据收集的成本和运算时间,一些vision people提出算法,用GAN或者别的neural network来取代某些建模的步骤。虽然并不能保证衣服的物理性质完全正确,但也是plausible的。

比如VITON(Han et al. CVPR 2018) 完全把这个task当成一个2D image task来做——直接以一张人的图片和一张衣服的图片作为输入,然后用GAN来直接生成这个人穿上这件衣服的样子。这种模型end-to-end,不涉及到任何3D运算。

再比如比如NHRR(Sarkar et al. ECCV 2020)2D转3D,先用densepose+SMPL把一张2D人像照片转换成3D人体模型,再用neural network从2D的衣服上学UV map,把衣服render到3D人体模型上。

最后如果对纯2D的虚拟试衣模型感兴趣可以阅读我的文章


References

Han, Xintong, et al. "Viton: An image-based virtual try-on network."Proceedings of the IEEE conference on computer vision and pattern recognition. 2018.

Sarkar, Kripasindhu, et al. "Neural re-rendering of humans from a single image."European Conference on Computer Vision. Springer, Cham, 2020.




  

相关话题

  如何看待谷歌研究人员提出的卷积正则化方法「DropBlock」? 
  如何理解「香农定理」,包含哪些内容,它的发现有什么意义? 
  神经网络中 warmup 策略为什么有效;有什么理论解释么? 
  如何评价CVPR2019程序主席Derek Hoiem的论点:计算机视觉只是记忆,不是智能? 
  为什么编程语言中没有一种 if,来判断大概率为真(或假)的情况,来提升 CPU 分支预测的速度呢? 
  如何看待倪光南表示中国人口红利将转化成工程师红利,成为信息领域强国?未来不懂技术的人会被淘汰吗? 
  大学学习linux是安装虚拟机,还是安装双系统。? 
  如何评价Momenta ImageNet 2017夺冠架构SENet? 
  为什么游戏引擎要渲染那么多内容还是能到 60fps? 
  学计算机的,因为家里穷买不起计算机而自卑怎么办? 

前一个讨论
语音识别中,声学模型与语言模型扮演什么角色?或者说是怎么通过两个模型进行语音识别的?
下一个讨论
人机交互中的一个热门研究领域 Tangible Interaction 在业内有常用的翻译吗?





© 2024-12-18 - tinynew.org. All Rights Reserved.
© 2024-12-18 - tinynew.org. 保留所有权利