首页

如何评价 NVIDIA 发布的 DGX-1？第1页

1

mli65 网友的相关建议:

分享下实际使用体验，主要针对深度学习。

DGX-1主要卖点是两个，p100和nvlink。

P100性能类似Pascal Titan X。跟Tesla前面系列比基本是 1 P100 ~= 2 M40 ~= 4 K40。在常见CNNs上具体性能可以参见

Performance - mxnet 0.7.0 documentation

NVLink号称提供三倍PCIe 16x的带宽，实测下来确实带宽有显著提升。不过比较纠结的是，DGX-1的GPU连接比较复杂，具体可以参考nvida blog的这张图

首先一块卡只能直接跟另三块卡通讯。要想跟更远的卡通讯，需要要么通过另外一块GPU，要么通过PCIe走CPU。目前CUDA 8似乎是默认走CPU。PCIe一个switch连2块GPU和一块CPU，外加一个IB接口。所以左上角GPU要跟右下角GPU通讯，那么就是

GPU <-> PCIe <-> QPI <-> PCIe <-> GPU

不管是latency还是bandwidth自然都是很差。综合下来，8卡的all-to-all通讯，我们发现DGX-1跟纯PCIe的EC2 P2.8xlarge差不多。

在DGX1比较好的做法应该是通过中间GPU来转，这样可以全走nvlink，但这样编程会稍微复杂点。

总结下是P100单卡性能符合预期，NVLINK用得好会不错，但需要额外针对性的优化。但考虑到其价格，仅推荐土豪用户购买。

个人推荐：小厂和个人用户推荐Pascal Titan X，大厂推荐PCIe based P100。

另外，Pascal下一代Volta据说也不远了，至少又是2倍的性能提升。真是一个幸运和不幸的时代。

如何评价 NVIDIA 发布的 DGX-1？的其他答案点击这里

1

相关话题

  有哪些人工智能上的事实，没有一定人工智能知识的人不会相信？
  英伟达称 Arm Grace CPU 超级芯片比英特尔 Ice Lake 快 2 倍，对此你如何评价？
  英伟达希望在 Omniverse 中创建地球的数字孪生体的目的是什么？
  国内做NLP业务的香侬科技值得去吗？
  深度学习图像处理什么时候用到GPU？
  卷积神经网络中卷积核是如何学习到特征的？
  苹果的M1M和M1P能吊打英特尔AMD还有英伟达吗？
  如何看待SIREN激活函数的提出？
  把某人的 DNA 序列作为输入，正面照片作为输出，丢到深度神经网络里面学习，可行吗？
  2020年，多标签学习（multi-label）有了哪些新的进展？

前一个讨论

做底层 AI 框架和做上层 AI 应用，哪个对自己的学术水平（或综合能力）促进更大？

下一个讨论

如何看待Jeff Dean&Hinton投到ICLR17的MoE的工作？

相关的话题

  为什么计算注意力机制的时候不加偏置项？
  CTC和Encoder-Decoder有什么关系?
  注意力机制是如何学习到模型所应注意的区域的？
  能分享你收藏的国外AI talk, seminar平台或网站吗？
  GAN（对抗生成网络）可以被用于哪些（商业或潜在商业）实际问题？
  NVIDIA 将创建 CPU 团队，拟招聘数百人，有哪些值得关注的信息？
  如何看待知乎的AI答主「四十二」？人工智能有可能理解生命的意义是什么吗？
  多任务学习成功的原因是引入了别的数据库还是多任务框架本身呢？
  如何评价 Self-Normalizing Neural Networks 这篇论文?
  《人工智能训练师国家职业技能标准》发布，有哪些值得关注的信息？
  如何看待在某度搜不到megengine官网？
  有没有必要把机器学习算法自己实现一遍？
  为什么 CPU 厂家这两年开始注重核显水平了？
  百度在深度学习上使用Xilinx FPGA?
  视觉算法的工业部署及落地方面的技术知识，怎么学？
  如何评价英伟达在 GTC 2022 正式发布的首款基于 ARM 的 NVIDIA GRACE CPU?
  生成式对抗网络GAN有哪些最新的发展，可以实际应用到哪些场景中？
  三维重建怎么入门？
  如何看待知乎的AI答主「四十二」？人工智能有可能理解生命的意义是什么吗？
  图片上训的模型，怎么迁移视频上呢？
  如何看待NVIDIA 即将开源的DLA？
  如何看待阿里巴巴提出的 FashionAI 比赛？
  主动学习（Active Learning）近几年的研究有哪些进展，现在有哪些代表性成果？
  三维重建怎么入门？
  大家推荐一下，哪些学校的导师有在做量化交易、股票预测的？
  为什么 MobileNet、ShuffleNet 在理论上速度很快，工程上并没有特别大的提升？
  写CUDA到底难在哪？
  为什么VAE-GAN的训练很容易发生梯度爆炸，如何避免？
  如何看待 Google 既可以作 Inference，又可以作 Training 的新一代 TPU？
  N系显卡正常更新换代速度是几年？

© 2025-06-14 - tinynew.org. All Rights Reserved.
© 2025-06-14 - tinynew.org. 保留所有权利