Top
首页 > IT产品和服务 > 服务器存储 > 高性能计算 > 正文

AMD Radeon Instinct加速卡或成深度学习和HPC中的新星

人工智能和机器学习,正在以几年前我们无法想象的方式改变世界,实现改变生活的突破,能够解决以前无法解决的问题。时至今日,AMD也正式开启了有关直觉式计算愿景的新篇章。
发布时间:2017-06-21 13:41        来源:赛迪网        作者:徐培炎

【赛迪网讯】早在2016年12月,AMD首先宣布了Radeon Instinct计划,并推出了对外预览Radeon Instinct加速卡,将计算研发能力与AMD在开源软件方面的努力相结合。

IMG_4597

人工智能和机器学习,正在以几年前我们无法想象的方式改变世界,实现改变生活的突破,能够解决以前无法解决的问题。时至今日,AMD也正式开启了有关直觉式计算愿景的新篇章。Radeon Instinct™ MI25、MI8和MI6结合AMD开放式ROCm 1.6软件平台,将大大提高性能,效率并且易于实施,从而加速深度学习推理,加速训练机器智能。

AMD不只是希望加速机器智能发展,而且要为下一代真正的异构计算提供动力。AMD宣称,将近期向合作伙伴出货Radeon Instinct™加速卡,包括Boxx,Colfax,ExxactCorporation、Gigabyte、Inventec和Supermicro等厂商,并从2017年第三季度开始驱动这些厂商的深度学习和HPC解决方案。

提供前所未有的机器智能

通过Radeon Instinct服务器加速卡产品和开放的生态系统,AMD能够为客户提供具有成本效益的机器和深度学习训练,边缘训练和推理解决方案,其中工作负载可以最大限度地利用GPU高度并行的计算能力。

IMG_4595

RadeonInstinct 首批三款加速卡旨在解决各种机器智能应用:

Radeon Instinct™ MI25 加速卡,基于“Vega” GPU 架构,采用14nm FinFET工艺,将成为世界上大型机器智能和深度学习数据中心应用的终极训练加速卡。MI25内建64个计算单元(4096个流处理器),在被动式冷却的单GPU服务器卡中提供优异的FP16和FP32性能,具有24.6 TFLOPS的FP16或12.3 TFLOPS的FP32峰值性能。凭借16GB超高带宽HBM2 ECC GPU内存和高达484 GB/s 内存带宽,Radeon Instinct MI25针对大规模并行应用进行优化,满足大型数据集机器智能和HPC级系统工作负载需求。

Radeon Instinct™ MI8加速卡,利用“Fiji”GPU架构的高性能,高能效,是一种小尺寸HPC和推理加速卡,具有8.2 TFLOPS峰值FP16 | FP32性能,板载功耗小于175W,内建4GB高带宽内存(HBM)和512-bit内存界面。MI8非常适合机器学习推理和HPC应用。

Radeon Instinct™ MI6加速卡,基于广受赞誉的“Polaris”GPU架构,是一种被动冷却的推理加速卡,其峰值FP16|FP32性能为5.7 TFLOPS,峰值板载功耗为150瓦,内建16GB超快速GDDR5 GPU内存,256-bit内存界面。MI6是一种多功能加速卡,适用于HPC和机器学习推理以及边缘训练部署。

Supermicro软件解决方案和基础架构副总裁MichaelMcNerney表示:“在过去一年里,我们与AMD在RadeonInstinct图形处理器方案中合作,我们将在型号为YS-4028GR-TR(T)/-TR(TT2)的4U SuperServer服务器当中初步支持多达八张RadeonInstinct MI25加速卡,为客户提供机器智能和高性能计算。我们期待为客户提供基于AMD Radeon Instinct产品的系统,利用其”Vega“GPU架构以及开放式生态系统加速HPC深度学习。”

RadeonInstinct硬件由AMD开源软件解决方案推动

可扩展的全开源ROCm 1.6软件平台,计划于6月29日推出,它的性能已经改进,并且支持MIOpen 1.0,为新一代混合Hyperscale和HPC级系统工作负载提供灵活,强大的异构计算解决方案。ROCm软件平台由开源Linux®驱动程序组成,为可扩展多GPU计算优化,提供多种编程模式,HIP CUDA转换工具,并使用异构计算编译器(HCC)支持GPU加速。开源的MIOpen GPU加速库现在可用于ROCm平台,支持机器智能框架,并且计划支持Caffe,TensorFlow和Torch。

Exxact公司业务发展总监Nicholas Chen表示:“AMD全新Radeon Instinct加速器,加上开放源码,以及支持可扩展的ROCm深度学习MIOpen框架,可以帮助加快下一代机器学习方面发明和创新浪潮,使我们能够提供专门设计的AI超级计算机,提供突破性能和结果。我们预计采用下一代”Vega“架构的Radeon Instinct MI25,结合我们的简化管理工具,将为深度学习推理和训练提供强大解决方案,为要求最苛刻的机器智能和HPC工作负载提供所需性能,效率和TCO。”

革新数据中心

Radeon Instinct MI25结合全新基于“Zen”的EPYC™服务器以及革命性的ROCm开放软件平台,将从底层为开放式异构计算和机器学习提供先进的方法。

技嘉技术研究与开发副总裁Daniel Hou表示:“通过开放的硬件和软件方式,AMD赋予我们客户以潜力,让他们在设计大规模系统时可以从底层进行定制。凭借Radeon Instinct MI25加速卡和AMD全新基于“Zen”的EPYC™服务器,我们现在能够为我们的客户提供无与伦比的服务器解决方案,提供令人难以置信的性能和成本效益,使其能够满足机器智能和高性能计算工作量日益增长的需求。”

可以预见,以基于“Zen”的Epyc™服务器和Radeon Instinct加速卡将引领下一代数据中心新趋势。

专题访谈

合作站点
stat