业界动态
挑战谷歌!中国公司争夺AI网络标准,阿里云,架构,技术
2024-05-17 05:03:47
挑战谷歌!中国公司争夺AI网络标准,阿里云,架构,技术

►文观察者网特约作者张颖(ying)

刚刚,超以太(tai)网联盟UEC技术咨询委员(yuan)会选出新成员(yuan),阿里云成为13名成员(yuan)中唯(wei)一的(de)中国公司,将携手(shou)微软、Meta、AMD、博通等科技巨头,推进开放网络(luo)的(de)研发及标(biao)准制定,打造下一代AI网络(luo)基础(chu)设施。

而就在前(qian)几日,阿里云打造的(de)AI高性能网络(luo)HPN7.0论文入选顶级(ji)国际学术会议SIGCOMM,引发业(ye)界(jie)热议,专家指出,这一架构极有可能取代此前(qian)谷歌提出的(de)Jupiter架构,而成为下一代AI网络(luo)架构标(biao)准。

随着大模型(xing)浪潮席卷(juan)而来,AI基础(chu)设施成为科技巨头们竞相角力的(de)最火热战场,而这次,中国占据了难(nan)得的(de)先机。

规模提升16倍!

超高性能网络(luo)为中国AI大模型(xing)提速

众(zhong)所周知,大模型(xing)需要大算力。在算力资源极度紧张的(de)当下,只有通过系统架构的(de)创新,才能实现AI的(de)弯道超车。高稳定、高性能的(de)网络(luo),则是支撑这一AI基础(chu)设施的(de)关键底层技术。

网络(luo)架构及技术来源于(yu)西方,也被(bei)西方垄断。谷歌2015年提出的(de)数据中心网络(luo)朱庇特(Jupiter)架构,是最主流的(de)技术线路,主导了业(ye)界(jie)数据中心网络(luo)架构的(de)设计。

直到2023年9月,阿里云推出新一代HPN7.0架构,宣告完成全球首(shou)个AI高性能网络(luo)集群的(de)突(tu)破;大半年后,HPN7.0论文被(bei)收录进国际顶会SIGCOMM,国际学术界(jie)第一次官方认可了这一重磅新技术。

专家表示,HPN7.0极有可能取代谷歌经(jing)典(dian)的(de)朱庇特架构,而成为下一代AI网络(luo)主流架构范式和标(biao)准。

HPN7.0不是翻修、精装,而是系统性重构。用一个通俗的(de)比喻,以往(wang)的(de)房子能住10个人,好的(de)科技公司一番操作可以往(wang)这房子里塞15人,而阿里云直接重新设计打造了一个能容纳100人的(de)房子。

一组数据显示,在传统通用计算集群架构下,单层交换机最多支持(chi)16~64张GPU极致性能的(de)直接互联;阿里云AI智算集群架构HPN7.0,单层交换机可以支持(chi)1024张GPU直接互联。相当于(yu)极致性能互联的(de)规模直接提升16倍!这就给AI大模型(xing)的(de)训(xun)练及推理带来足够大的(de)网络(luo)性能保障。

HPN7.0架构:为AI设计的(de)高性能网络(luo)集群

基于(yu)HPN7.0打造的(de)阿里云AI基础(chu)设施,可高效协(xie)同调(diao)度各类芯片(pian),支持(chi)高达10万卡量级(ji)的(de)集群可扩展规模,实现网络(luo)的(de)高性能和高稳定互联,让超大集群像(xiang)一台计算机般高效运转,帮助大模型(xing)训(xun)练较(jiao)上代提升性能14.9%。

前(qian)不久(jiu)阿里云发布通义千问2.5版本大模型(xing),中文性能全面赶(gan)超GPT-4Turbo,就是基于(yu)HPN7.0高性能网络(luo)集群训(xun)练而成。

可以想见,未来,国内所有公司都(dou)能通过阿里云而获得高质量的(de)AI网络(luo)服务,将大大有利于(yu)中国大模型(xing)发展及应用落地。

拥抱开源

阿里云牵头制定AI智算网络(luo)的(de)“安卓”标(biao)准

目前(qian),AI高性能网络(luo)有两个主要标(biao)准,一种是英伟达主导的(de)私(si)有标(biao)准InfiniBand,另(ling)一种则是RoCE v2(基于(yu)融合以太(tai)网的(de)RDMA网络(luo))。

这两种标(biao)准犹如网络(luo)领域的(de)苹(ping)果和安卓:一个自给自足,基本封闭;一个开源开放,最具活力。选择哪一种标(biao)准,基本上就选择了那种标(biao)准代表的(de)全套设备、系统、软件及应用。

这其(qi)中,尤以Linux基金会发起成立开源组织——超以太(tai)网联盟UEC发展最为迅速,科技巨头纷纷加入,让UEC成为当下最热门、发展最火热的(de)AI基础(chu)设施相关组织。

最新消息显示,在UEC最核心的(de)技术委员(yuan)会选举中,阿里云成功入选,成为唯(wei)一的(de)中国公司成员(yuan)!这意味着,在下一代开放网络(luo)的(de)核心技术研发决策方面,首(shou)次出现中国科技公司身影,阿里云将连同微软、Meta、AMD、博通等科技巨头,一起参与(yu)核心决策及标(biao)准制定!

知情(qing)人士透露称,UEC技术委员(yuan)会成员(yuan)席位竞争十分激(ji)烈(lie),只有技术实力过硬、对(dui)开源社区贡献大的(de)成员(yuan)才能通过选举投票当选。阿里巴巴是AMiner全球十大网络(luo)研究机构中唯(wei)一的(de)中国公司,阿里云也是开放网络(luo)SONiC社区7个发起成员(yuan)之一和技术委员(yuan)会副(fu)主席单位。专家指出,此次入选UEC技术委员(yuan)会,充分证明了中国网络(luo)技术已经(jing)得到了业(ye)界(jie)同行的(de)充分认可。

有消息透露,基于(yu)HPN7.0的(de)大规模实践,阿里云正牵头推进面向AI需求的(de)网络(luo)性能提升项目等技术草(cao)案,而这一方向恰(qia)巧就是UEC对(dui)未来技术布局最重要的(de)方向之一。

从落后到赶(gan)超,再到如今(jin)参与(yu)决策未来技术方向和标(biao)准制定,以阿里云为代表的(de)中国科技公司,默默耕耘十余(yu)年,才能在这个AI大时代的(de)底层网络(luo)基础(chu)设施领域持(chi)续突(tu)破,让中国方案打破垄断,成为全球通用的(de)开放技术标(biao)准,让AI更好更快地服务于(yu)人类世(shi)界(jie)。

发布于(yu):上海市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7