咨询热线:0371-85608552

手机网站|English

产业AI化算力是刚需!从国际超算大会传递怎样的计算新风向?

来源:树脂涂层支撑剂    发布时间:2024-05-25 12:47:56

描述:

...

产品详细

  美国时间11月19日,2019国际超算大会(SC2019)在美国丹佛举行。作为一年一度的世界级IT盛会,今年的SC与往年一样,成为全世界计算力的风向标,也成为领先计算厂商发布新品和展示实力的重要平台。

  随着计算能力的提升,超算不再只是科学研究的利器,而已经深入到我们的生活当中。从宇宙探索、气象预报到精准医疗、无人驾驶,超算的身影随处可见,影响力不断的提高。今年大会主题是“超算正当时”(HPC is now),恰如其分地表达超算的价值和影响力。

  超算之所以能拥有今天的价值和活力,离不开人工智能发展的促进。在大数据、多任务的环境下,AI的应用模型复杂度以及训练规模的快速提升,需要超级计算的强大能力支持AI的发展需求,超算技术被慢慢的变多地引入人工智能。从这次大会上多位中美欧专家、学者分享的超算应用成果看,AI已成为超算的重要应用方向,超算正在和AI融合发展。

  事实上,本次大会上一些领先计算厂商发布的新产品、展示的新理念,已体现出超算和AI的融合应用趋势。例如,浪潮商用机器(简称IPS)推出的全自研首款超强异构计算服务器FP5468G2,拥有全场景超强异构计算能力,能够支持AI云平台建设、深度学习训练和推理等应用,为HPC与AI的融合应用需求提供了更好的选择。

  那么,从超算大会上传递的计算风向和发布的全新产品,会给当前正在进行“AI+”的各行各业带来怎样的落地效应?

  计算、算法和数据是AI发展的三大关键要素,而计算则是AI走向应用的基础和支撑力。AI对于计算力的需求,能够说是无限度的“刚需”,且呈指数级增长。据OpenAI报告数据显示,从2012年到现在以来,每3.5个月用于AI计算的计算量会翻一倍,增长了30万倍以上,远超于了芯片性能提升的摩尔定律。

  随着前沿创新应用的不断深入,AI消耗计算力的速度远比想象的要快得多,尤其是神经网络层数的增大,层间连接的增加,数据规模的不断膨胀,加上未来新的模型和算法的出现,将让AI对计算能力的需求有几何级的增长。

  我们知道,芯片是驱动计算力的核心,而摩尔定律逐渐逼近极限,传统通用CPU“难堪重任”,已不足以满足AI对爆发的计算能力需求。在次背景下,异构计算芯片“应运而生”加快速度进行发展,成为支撑先进和更复杂AIoT应用的必然选择。

  异构计算是一种将不同指令集和架构的计算单元(如传统的CPU、GPU、DSP还有创新的TPU、DLA等)融合在一起、实现高效协同运行的计算技术。如果把传统架构比作汽油引擎,那么异构计算就是混合动力甚至新能源引擎。

  异构计算的显著优点是实现了性能、成本和功耗均衡的技术,通过让最适合的专用硬件去做最适合的事,如密集计算或外设管理等,进而达到性能和成本的最优化。

  从有关数据看,中国异构计算的黄金时代也已临近。据统计,中国异构计算服务器市场2019年市场规模预计达到18.5亿美元,同比增长25.6%,预计到2023年达到44.5亿美元,CAGR为27.8%。

  目前市场上, GPU加速计算服务器市场销售额在异构计算服务器市场整体销售额的占比达到98%以上。在中国GPU加速计算服务器市场中,8卡和16卡的机型市场顶级规模且增长率较高。

  POWER9处理器也在积极拥抱异构计算,比如支持NVLink 2.0、CAPI 2.0和New CAPI等。面向加速器件、异构综合器件开放,大幅度的提高加速效率,深度学习框架性能超x86近4倍。

  据了解,IPS旗下OpenPOWER系列服务器凭借全新POWER9具备的NVLink 2.0、PCIE 4.0和New CAPI的硬件加速优势,支持CPU-GPU互联,面向加速器件、异构综合器件开放,能够为AI平台建设提供强大、灵活的计算平台支撑。

  最新发布的FP5468G2,就是一款具有超强异构计算能力的服务器。它支持8 块V100或者16块 T4 GPU,提供全场景异构计算能力;支持2颗POWER9 Sforza处理器,具有多达44个核心、176线程超强调度能力,针对特定深度学习模型调优,性能相较同等X86平台可提升多达20%,并全面兼容FPGA/AISC,提供特定应用加速。

  当前,随企业数字化转型的推进,各行各业都加大对AI的落地需求,AI的发展从AI产业化进入产业AI化新阶段。据IDC《2019年上半年中国AI基础架构市场跟踪报告》显示,互联网行业对AI的投入由以往60%以上的市场占有率降至40%左右,政府,教育,金融、制造等传统行业逐渐加深与AI应用的融合。

  随着AI快速落地更多的行业,数据和任务量更为巨大繁杂,对计算的性能和计算的多样性要求会慢慢的高。

  因为,与互联网场景相比,传统行业面对的场景要复杂得多,不一样的行业有不同的应用场景和行业特点,即使同一个行业的不同企业,应用场景也可能千差万别。以制造业为例:食品生产和药品生产、机械设备生产的不一样;十个人和几万人的企业也不一样。支持这些复杂环境的将是一个异构计算模式。

  而FP5468G2是一款以全场景超强异构服务器,正是为满足AI云平台建设、深度学习训练和推理等多样复杂的计算而生。

  传统行业企业落地AI,除了看重超强的计算性能、复杂多样的应用场景外,还看重什么?那就是——

  相比互联网行业,传统行业企业普遍成长性较低,赚钱不容易,在AI应用和落地部署中,注重技术价值兑现。

  如果说消费互联网公司的AI转型是为了追求流量,那么传统行业企业更务实,他们最在意的是TCO和ROI,也就是降本和增效。以我国正在全力发展的先进制造和人机一体化智能系统为例:

  中国制造业企业普遍利润率较低,中国制造业500强的利润率已从2010年5%的高位跌到了近年的2%左右,它们渴望通过数字化智能化转型,减少相关成本提升效率。如果AI产品和解决方案不能帮助它们在成本和效率上得到提升,企业不愿意买单,AI就很难落地。

  由于IPS在制造等传统行业的用户和解决方案众多,约70%的制造业企业都选择了POWER的产品和解决方案,所以,IPS很清楚行业企业对TCO和ROI的考虑,每次迭代推出新产品时,都考虑提升计算性能的同时,尽量把TCO降到更低。

  比如,这次发布的FP5468G2,相比此前推出的标准化服务器FP5280G2,大幅度降低了TCO。

  一是超低功耗,节省巨额电量。根据算力需求,按照单机支持16块T4推算,在强大的计算密度支持下,1台FP5468G2性能相当甚至优于4台FP5280G2,而功耗仅为4台FP5280G2不到80%,非常大地节省了用电量。

  以某互联网客户1年需求400台GPU服务器(根据算力需求,按照单机支持16块T4推算)为例,假设工业用电计1元/kW·h,3年节省电费可达1261.5万。

  二是超高计算密度,大幅节省TCO。由于FP5468G2算力高,一台机器可以替代多台传统机器。FP5468G2相比普通2U 4GPU服务器, 计算密度提升1倍,在支持相同数量GPU条件下,FP5468G2相较低密度GPU服务器集群,空间可节省一半,电力节省23%,实测算力提升8%,而价格降低34%,500台规模集群可节省TCO过亿元。

  在相同GPU数量需求下,1台4U高FP5468G2对应4台2U高FP5280G2,部署密度提升1倍(4U vs 8U),可节省机柜用量,占地面积大幅减少。

  相比互联网公司,传统行业企业落地AI,除了有降本增效的硬要求,还有自己的“特殊需求”,那就是需要一体化的整体解决方案和实施方案。因为相比互联网公司,大部分传统行业企业都缺乏AI方面的人才和技术能力。

  为了满足传统行业企业落地AI的多样化个性化和一体化的需求,IPS以全新POWER9处理器为核心,全面布局,从横向领域和纵向领域进行扩展:

  在横向扩展领域,驱动AI计算力跃级,面向AI、大数据分析、分布式数据库、内存计算、GPU数据库等新兴应用领域,提供针对数据和认知的基础架构,满足企业的多样业务需求;

  在纵向扩展领域,继续以高性能、高稳定性和卓越的定制服务为企业关键业务搭建核心承载平台,以超强的弹性拓展能力支持面向关键应用场景的深度优化。IPS加快了高性能计算和AI融合的步伐,以POWER9为根基打造全线产品。

  此外,还基于服务器产品提供分布式存储软件堆栈、AI/HPC软件堆栈,与行业合作伙伴共同打造了一系列面向机场/安防、医疗、教育等各种AI应用一体化解决方案,如专注于视频和图像的解决方案等,成为大数据、分布式存储、AI/HPC等创新应用的优选平台。

  熟悉IPS的人会知道,IPS “出身名门”,由浪潮和IBM合资成立,于2018年5月2日正式运营。IPS已发布拥有POWER9芯片为核心的全线服务器产品,从纵向扩展和横向扩展等方向,支撑产业AI化的各种应用。

  应该说,在产业AI化机遇面前,IPS,从计算产品到一体化解决方案,都已准备好了。返回搜狐,查看更加多

上一篇:【48812】写在新的新江桥通车之际:重生的开端 回忆的连续 下一篇:【48812】让固态废料变成“宝物”​!省级再生资源技能立异中心将落地大旺​!

全国销售热线
0371-85608552

销售咨询电话
13838570777