鲲泰新闻|神州鲲泰创新智算之旅北京站开幕,发布全新智算架构和液冷整机柜产品应对 “多云、异构、绿色”挑战

5月17日,神州鲲泰智算中国行北京站盛大召开。在本次活动上,神州鲲泰针对用户对大模型训练、大算力需求的痛点,重磅发布多云异构环境下智算中心绿色着陆的产品及方案,包含异构智算调度运营平台HISO、异构智算加速平台HICA以及一体化交付的神州鲲泰全液冷整机柜产品。帮助企业客户在整个异构智算资源池中匹配更优算力组合、有效提升GPU服务器集群的资源使用效率、有效解决节点和节点间互联的能耗问题,助力企业构建性能更优、成本更低、能效更高、能耗更低的智算基础设施底座。

664ce5828132f

664ce5820cf40

神州数码信创业务集团副总裁、研发中心总经理周川

异构智算时代,企业智算落地如何降本增效

在全新的异构智算时代,多云异构智算基础设施已成为必然,一个独特的“智算攒机时代”,正在呼唤全新的智算架构。与此同时,随着大模型和生成式AI加速落地,大量的模型训练和推理任务,在唤醒底层算力海量需求的同时,也对资源利用率提出了巨大挑战。有关资料显示,OpenAI训练GPT-4的MFU(Model Flops Utility)在32%到36%之间。而目前行业MFU利用率的平均水平仅为30%~40%,智算资源利用率的提升将为企业节省大量成本。

能耗是另一个大的挑战,算力本身会成为主要的能耗和二氧化碳排放来源,更不用说GPU的能耗本身是CPU能耗的2倍以上。根据MIT研究表明,未来人类需要为人工智能相关应用新增10%的能源需求,形象的说,“炼”大模型会比炼钢还费电。对于一个企业来说,每新增一个用于智算的机架,其运行一年约等于增加15w度电,够100个家庭生活用电一年,约排放1.5吨二氧化碳,能耗和碳排放都十分巨大。

尽精微,神州鲲泰“双管齐下”提升算力资源利用率

神州鲲泰推出异构智算调度运营平台HISO、异构智算加速平台HICA,有效解决智算集群间以及集群内面临的复杂异构兼容问题,显著提升算力资源的利用率。

神州鲲泰异构智算调度运营平台HISO基于云原生技术,整合GPU硬分片和虚拟分片技术,能实现GPU资源虚拟化或池化,完成跨集群之间的算力调度。根据用户业务需求,该平台可以在整个异构智算资源池中匹配优选算力组合,提升GPU服务器集群的资源使用率。神州鲲泰异构智算调度运营平台HISO拥有将国内外GPU资源混合组网、混搭调度,算力精细隔离等关键能力,可以“像管理一台GPU主机一样,管理和调度多个集群的GPU资源”。通过GPU容器直通、IaaS卸载,该平台加速了模型加载时间,相比传统方式,模型加载速度提升3倍。同时还能实时收集智算中心全栈、全链路指标,发现和定位软硬件故障,实现算力可观测性。

神州鲲泰异构智算加速平台HICA则着重解决集群内部的算力调度优化问题,通过屏蔽集群内底层算力生态差异,突破关键计算效率瓶颈,有效提升算力利用率与可用性。神州鲲泰异构智算加速平台HICA通过自研的服务层、中间适配层以及调度编排算法,采用数据并行、模型并行等方式,把并行计算任务进行有效分解,匹配相应的软件栈和算力资源来承接。当GPU资源变化,该平台可以实时动态调度计算子任务并调整模型拓扑和架构,以充分聚合各种算力资源。

神州鲲泰异构智算加速平台HICA具有一云多芯特性,支持国内外主流AI芯片,可实现训练推理任务在不同品牌、不同型号芯片组成的智算集群中的混合训练推理,预计可降低20%闲置算力。

此外,根据不同模型、不同算子之间集合通信流特点,该平台还可自适应选择最合适的通信参数,达到更高的通信效率。同时,在不同模型运行过程中,充分考虑存算比要求的不同,异构智算加速平台HICA还可从宏观到微观多个尺度选择最合适的存算比资源加载模型,加速吞吐,降低时延,使MFU提升10~20%,MBU提升5%。

硅光+液冷冷却跳动的电表,一体化交付让客户省时省力

随着生成式AI落地对算力需求的暴涨、带宽的狂飙提速,智算中心节点的高能耗痛点日益加剧。而以一个万卡智算中心为例,采用200G接口互联,需要约80000个光模块,其互联所需的能耗则占到总体的5%。节点间互联的高能耗问题也日益凸显。

针对节点间互联的能耗问题,神州鲲泰采用硅光技术,通过单光源多调制器,降低调制器电压,同时采用分布式反馈激光器等一系列技术,有效降低25%的互联能耗。

同时,针对节点的能耗问题,神州鲲泰推出液冷服务器,通过一体化冷板,智能流量调节来提升系统的散热效率,采用负压管线系统,漏液近端探测技术,并联动服务管控系统提升冷却系统的可靠性,有效降低30%的节点能耗。

而为了帮助客户规避接口多、接头复杂、现场实施部署难度大、实施周期长等难题,数云原力大会2024开幕式上,神州鲲泰正式发布“KunTai Pod2000全液冷整机柜”方案产品。采用一体化交付方式,有效降低部署和运维的复杂度的同时,整机柜还能实现100%全液冷及高性价比液冷方案,助力数据中心PUE迈向1.15,并且凭借60KW+的最大单柜功率,实现1.5倍于行业平均水平的能效比,在为客户提供强大算力的同时有效控制能耗成本。

神州鲲泰整机柜产品搭载鲲鹏+昇腾主板,一体化交付的方式已经在运营商客户得到落地验证,广受好评,硅光+液冷更是让整机柜产品得到全面升级,为客户打造出功能更强、能耗更低、效率更高的智算中心。

664ce5814830c

随着2022年底ChatGPT的问世,AI正成为推动创新的核心引擎。现在的IT基础架构已经到了一个由模型和算力相互促进,螺旋上升的新发展阶段。面对新的发展机遇,神州鲲泰从智算中心系统整体性能提升出发,提出了走新智算架构之路的策略,建立了高通量、高并行、高效率,低能耗的多样化智算架构。新的智算架构能够快部署、低投入地突破算力瓶颈,构建出性能更优、成本更低、能效更高的智算中心。未来每个智算中心,每台计算机都将是这样一种新的智算架构,从而实现算力的普惠。

本网信息来自于互联网与网友投稿,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。https://dbsb.syxbgm.com/6505.html

(0)
上一篇 2024年5月21日 下午4:00
下一篇 2024年5月23日 下午3:57

相关推荐

  • 安保泓产业大平台首次亮相2023首届中华老字号(东北)博览会

    4月21日-23日,2023首届中华老字号(东北)博览会在辽宁工业展览馆召开。本届博览会设老字号企业、非遗产品、一乡一品以及东北特色产品等多个展区,旨在挖掘潜在市场商机,振兴老字号品牌。 安保泓产业大平台作为一个新兴、优质的B2B产业大平台,同时也是东北老字号的服务单位,本次携手平台上的几家东北老字号客户:哈尔滨大台北鞋城、沈阳百年烟斗、哲里木金店&…

    2023年4月24日
    0
  • 一个格力大经销商的倒戈“空调老大”遭经销商抛弃!

    一个格力大经销商的倒戈“空调老大”遭经销商抛弃! 河北格力总经销商:不做格力,转做飞利浦。为什么我会断了河北经销商的货?董明珠为什么总是得罪人?“空调老大”被经销商抛弃,河北格力宣布不干了!转移到飞利浦 河北格力总经销商(河北新兴格力电器销售有限公司)董事长徐自法在最近的一次活动中宣布“不再做格力”,成为飞利浦。“空调老大”遭经销商抛弃,董明珠为什么总是得罪…

    资讯 2022年12月18日
    0
  • 异格技术完成数亿元Pre-A+轮融资,博将资本投资

    近日,苏州异格技术有限公司(以下简称“异格技术”)宣布完成数亿元Pre-A+轮融资,博将资本在参与Pre-A轮投资后,持续投资。这两轮融资是继2022年获得经纬中国、红点中国、红杉中国等机构数亿元天使轮融资后,投资方对其战略布局与研发实力的再次高度认可。本轮融资后,异格技术将加快技术研发以实现产品早日交付。 博将资本投资的异格技术成立于2022年1月,总部位…

    2024年7月18日
    0
  • 站在行业C位,谷医堂打开健康管理服务新思路

    站在行业C位,谷医堂打开健康管理服务新思路 对于农村及贫困地区老百姓来说,由于交通因素和家庭经济条件制约,看病难致身体调理情况一直不太乐观,这也导致心理压力很大。然而,随着近年中医药产业崛起与快速发展,这种局面很快就会得到改观,以湖南谷医堂为代表的中医药企业正逐步打通农村中医诊疗的“最后一公里”。 记者通过查证了解到,今年1月28日,湖南省发展和改革委员会同…

    2023年2月15日
    0
  • 我国将建造国际月球科研站!成功与“天和核心舱”对接!

    我国将建造国际月球科研站!成功与“天和核心舱”对接! 今年7月份,随着长征五号B运载火箭的腾空,23吨重的“问天实验舱”被顺利送达预定轨道,经过13个小时的交会,成功与“天和核心舱”对接,完成了“天宫空间站”建造任务的2/3。 我国“天宫空间站”主要由三个舱段组成:天和核心舱、问天实验舱和梦天实验舱。据悉,“梦天实验舱”已全部研制完成,计划今年10月份在文昌…

    资讯 2022年12月17日
    0