谁说公有云服务跑不动HPCAWS持续提供多种解决方案重新在公有云环境组建适合高效能运算的IT基础架构
原标题:谁说公有云服务跑不动HPCAWS持续提供多种解决方案重新在公有云环境组建适合高效能运算的IT基础架构
李宗翰摄影
【美国拉斯维加斯现场报导】原本是学术领域较常用到的高效能运算(HPC)技术,如今随着大数据分析与人工智慧的走红,开始日益受到重视,但过往我们可能必须在设有超级电脑的特定环境,才能发展相关的应用,然而,随着运算技术的进步,如今我们可以透过串连多台x86伺服器,搭配GPU加速卡,也能支援高效能运算的各种应用。
然而,如果要在伺服器虚拟化平台、云端服务的环境,执行高效能运算,至今似乎仍相当少见,因为大家总会担心在这样的虚拟、多租户共享的架构下,运算和I/O效能都会有折损,如何还能支撑高效能运算的使用场景。
不过,现在有公有云业者想要打破这个刻板印象,希望吸引更多有这方面需求的用户,也能积极考虑採用公有云环境。举例来说,今年AWS在年度全球用户大会re:Invent的第一天,AWS全球基础设施与客户支援副总裁Peter DeSantis就以此为题,讲述他们现在其实已经能够负荷这样的应用情境。
为何现在AWS提供的IT基础架构,已做到能让一般用户向其租用超级电脑等级环境的需求?Peter DeSantis列出了他们重新发明超级电脑架构的历程。
首先,是建立了高速、低延迟、大容量的资料中心网路。经过6年的发展,AWS目前提供的执行个体(虚拟机器或裸机的租用服务),有了相当大的进步,不只是虚拟CPU的颗数增加了1倍多,尤其是网路规格就成长了10倍(10Gb vs. 100Gb),在整体网路负载的能力上,更是差距20倍以上(460 Tbps vs.10,600 Tbps)。
第二,将所有虚拟化作业都卸载到AWS发展的晶片与硬体技术。这里所指的硬体技术,主要是AWS与2015年併购的Annapurna Labs研发的Nitro Controller架构,在这样的系统之下,EC2所有虚拟化功能都是执行在Nitro Controller,网路流量虽然转为虚拟化,但延迟度、变化性、成本均可降到最低。目前而言,EC2的C5和C5n都是基于这个技术而成的执行个体。
第三,AWS发展出硬体最佳化、核心旁路的网路堆叠(Kernel Bypass Network Stack)。他们在2018年的re:Invent大会宣布推出的网路介面Elastic Fabric Adapter(EFA),就是一个例子。相较于原本只用TCP来进行Incast的传送,改用EFA来处理,可缩短传送较快者与传送较慢者之间的传输时间差距。
第四,整合常用的程式库与应用程式。以EFA而言,不只是Amazon Linux支援,也有其他软体或应用程式介面支援,像是Ubuntu、Red Hat、SUSE、OpenFOAM、LS-DYNA、Open MPI。
最后,要有很好的使用案例。Peter DeSantisu也举出几个企业应用实例,主要是销售风扇的Big Ass Fans公司,以及与AWS合作的F1赛车。
-
科技快讯:Intel10nmIceLake服务器处理器将在四季度发布
2023-04-14 -
AWS更新应用程式负载平衡器现可依权重分配流量比例
2023-03-24 -
Nvidia发表AI与HPC专用的统一运算架构HGX-2每秒可训练超过15万张图片
2023-03-22 -
科技快讯:阿里云发布第三代神龙架构在IOPSPPS等方面提升5倍性能
2023-03-18 -
Kong推出开源服务网路控制平台Kuma
2023-03-17 -
以支援HPC跻身400GbEDell EMC推出最高阶开放式交换器
2023-03-11 -
Kubernetes正悄悄改变HCI的未来
2023-02-19 -
银豹收银系统怎么样(银豹收银系统是啥)
2023-01-23 -
Azure资讯安全中心使用机器学习针对虚拟机器提供网路安全性群组规则建议
2023-01-19 -
gt750m显卡怎么样(gtx765m什么级别显卡)
2022-12-31 -
Mozilla浏览器可能即将推出
2022-12-25 -
现代企业的架构流程
2022-11-27 -
思科扩大意图式网路适用範围发展多领域架构囊括IoT与OT网路管理与防护
2022-10-16 -
增添容器OS安全遵循与OVN网路红帽OpenShift迈入4.6版
2022-09-12