首页

如何评价 NVIDIA 发布的 DGX-1？第1页

1

mli65 网友的相关建议:

分享下实际使用体验，主要针对深度学习。

DGX-1主要卖点是两个，p100和nvlink。

P100性能类似Pascal Titan X。跟Tesla前面系列比基本是 1 P100 ~= 2 M40 ~= 4 K40。在常见CNNs上具体性能可以参见

Performance - mxnet 0.7.0 documentation

NVLink号称提供三倍PCIe 16x的带宽，实测下来确实带宽有显著提升。不过比较纠结的是，DGX-1的GPU连接比较复杂，具体可以参考nvida blog的这张图

首先一块卡只能直接跟另三块卡通讯。要想跟更远的卡通讯，需要要么通过另外一块GPU，要么通过PCIe走CPU。目前CUDA 8似乎是默认走CPU。PCIe一个switch连2块GPU和一块CPU，外加一个IB接口。所以左上角GPU要跟右下角GPU通讯，那么就是

GPU <-> PCIe <-> QPI <-> PCIe <-> GPU

不管是latency还是bandwidth自然都是很差。综合下来，8卡的all-to-all通讯，我们发现DGX-1跟纯PCIe的EC2 P2.8xlarge差不多。

在DGX1比较好的做法应该是通过中间GPU来转，这样可以全走nvlink，但这样编程会稍微复杂点。

总结下是P100单卡性能符合预期，NVLINK用得好会不错，但需要额外针对性的优化。但考虑到其价格，仅推荐土豪用户购买。

个人推荐：小厂和个人用户推荐Pascal Titan X，大厂推荐PCIe based P100。

另外，Pascal下一代Volta据说也不远了，至少又是2倍的性能提升。真是一个幸运和不幸的时代。

如何评价 NVIDIA 发布的 DGX-1？的其他答案点击这里

1

相关话题

  如何看待马毅老师深度学习第一性原理的文章在 ICML 四个审稿人一致接收的情况下被 AC 拒了？
  什么是meta-learning?
  机器学习，深度神经网络等方法是否是正确的方向？
  有没有什么可以节省大量时间的 Deep Learning 效率神器？
  OpenAI 发布文字生成图像工具 DALL·E 2，它的画作水平如何？从技术角度如何评价它的能力？
  上学和读书有什么区别?
  深度学习调参有哪些技巧？
  华为GPU Turbo 和Nvidia GPU 有什么区别吗？
  如何理解 natural gradient descent?
  Resnet到底在解决一个什么问题呢？

前一个讨论

做底层 AI 框架和做上层 AI 应用，哪个对自己的学术水平（或综合能力）促进更大？

下一个讨论

如何看待Jeff Dean&Hinton投到ICLR17的MoE的工作？

相关的话题

  为什么感觉AMD开挂了？
  如何理解深度学习源码里经常出现的logits？
  现在tensorflow和mxnet很火，是否还有必要学习scikit-learn等框架？
  如何评价Google发布的第二代深度学习系统TensorFlow?
  如何看待NVIDIA扮演官方黄牛，将8999元的RTX 3080 Ti公然拉高到1万多元的价格？
  实验室只有1080的显卡，老师还想让发深度学习论文，也不给配置好的显卡怎么办？
  英特尔副总裁称「需将计算力提升 1000 倍才能实现元宇宙」，透露出了哪些信息？
  目前 AI 在疾病的诊断和治疗上，有哪些成功的应用？
  如何看待英伟达 Nvidia 可能达成收购 Arm 的交易？将会有哪些影响？
  迁移学习入门，新手该如何下手？
  resnet（残差网络）的F（x）究竟长什么样子？
  用生成模型做数据增强data augmentation时，如何从合成数据中筛选出质量较好的样本？
  国内哪些公司在用caffe、torch、TensorFlow、paddle等框架，哪些在用自研框架？
  如何看待 AMD 超微半导体弑龙勇士终成恶龙？
  如何看待NVIDIA扮演官方黄牛，将8999元的RTX 3080 Ti公然拉高到1万多元的价格？
  神经网络的万能逼近定理已经发展到什么地步了？
  超威半导体（AMD）那么好为什么还要选择英特尔和英伟达？
  应该选择TensorFlow还是Theano？
  如何评价清华大学发布的自研深度学习框架-计图(Jittor)？
  如何评价「Patches are all you need」?
  如何进行图像模糊与清晰的分类？
  你遇见过什么当时很有潜力但是最终没有流行的深度学习算法?
  如何看待 Google 既可以作 Inference，又可以作 Training 的新一代 TPU？
  AI（或者说神经网络/深度学习）能够实现科学（尤其是物理学）研究中提出假设这一步嘛？
  什么是迁移学习 (Transfer Learning)？这个领域历史发展前景如何？
  b站蒸気火鸡是a炮还是AMD公关，怎么天天黑英特尔英伟达？底下粉丝狂叫AMDyes？
  为什么谈论深度学习工具时，很少有人讨论matlab的神经网络工具包？
  如何看待英伟达 Nvidia 可能达成收购 Arm 的交易？将会有哪些影响？
  NV发布了30系显卡，PS5和XSX是不是涼了?
  如何评价CVPR2019程序主席Derek Hoiem的论点：计算机视觉只是记忆，不是智能？

© 2025-06-17 - tinynew.org. All Rights Reserved.
© 2025-06-17 - tinynew.org. 保留所有权利