NCCL支持RDMA。
理论上,从算法上gloo的没有道理比NCCL更好,因为gloo 至多也用ring allreduce。
实际上实现上,应该没有其它库超过NCCL,NCCL的实现充分利用了流水线来重叠传输和计算。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有