记者5月14日从阿里云获悉,阿里云AI高性能网络架构HPN 7.0成果论文已被SIGCOMM2024收录,成为SIGCOMM历史上首篇关于AI智算集群网络架构的论文。
SIGCOMM全称为Special Interest Group on Data Communication, 是计算机网络通信领域权威的专业论坛。此前谷歌Jupiter网络入选SIGCOMM后发展成为经典架构,有专家指出,阿里云HPN7.0有望成为下一代AI高性能网络架构的新范式。
大模型对AI基础设施提出了更高要求,阿里云新一代HPN7.0架构,为AI时代超大规模、超高稳定性的网络需求而研发。HPN 7.0创新性地设计了“双上联+多轨+双平面”的网络架构,并自研Solar-RDMA和ACCL通信库,可实现网络的高性能和高稳定互联。
2023年9月,HPN7.0在阿里云展开大规模部署,大模型训练性能较上一代架构在典型场景下提升14.9%,且大幅提高了智算网络整体稳定性。前不久阿里云发布通义千问2.5版本大模型,就是基于HPN7.0高性能网络集群训练而成。
阿里云自2017年开始即探索端网融合的可预期网络。阿里云基础设施网络负责人蔡德忠介绍称,HPN7.0更进一步,把端网融合的体系结构从网络协议栈拓展到网络架构和通信库,“实现了面向AI智算时代的全新网络集群架构创新”。
作为计算机网络通信领域顶级的国际学术会议,SIGCOMM始于1977年,每年论文入选率在10%~20%之间,入选成果极有可能成为主流技术范式标准。此前,谷歌传统数据中心网络Jupiter论文SIGCOMM收录,成为经典架构;此次阿里云HPN7.0架构斩获SIGCOMM首篇AI高性能网络论文,系中国公司首次为全球AI网络基础设施的设计及实践提供的高性能标准。
今年阿里云共有6篇论文被SIGCOMM收录。阿里云在高性能网络领域有多年技术积累,提出了端网融合的可预期网络技术体系,并在业界率先完成RDMA低延时网络、智算集群网络架构HPN 7.0等先进技术的大规模实践。阿里巴巴还曾获评AMiner全球十大网络研究机构,是榜单中唯一的中国科技企业。
科技日报北京12月18日电 (记者张佳欣)美国威斯康星大学麦迪逊分校工程师使用超音速冷喷涂技术,生产出一种新的核聚变“ 中新网上海12月19日电 (记者 许婧)上海交通大学分析测试中心实验动物中心新大楼启用仪式19日举行。随着新大楼的落成,一 过去的数个月,对我国道路交通智能检测领域知名专家赵祥模教授来讲,一如既往地保持着忙碌而有序的“快节奏”,他从容地在多 12月16日,2023第二届可持续能源发展国际会议在北京开幕。此次会议以“零碳科技、创新未来”为主题,汇聚了来自全球多 文|卜金婷 田瑞颖 《自然》近日发文警告,对人工智能(AI)的不当使用或将催生大量不可靠或无用的研究,导致可重复性 文 | 《中国科学报》记者 张双虎 1月19日,“国家工程师奖”表彰大会在人民大会堂举行,81名个人被授予“国家卓越工程师” 。本文链接:阿里云新一代网络架构论文,入选全球顶会http://www.sushuapos.com/show-11-6076-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
下一篇: 中国首部细胞外囊泡英文书籍全球首发