Top
首页 > 正文

模式变革推动AI和高性能计算工作负载融合

高性能计算会成为一个基本工具,这一点在疫情当中尤为凸显。高性能计算和人工智能的融合是高性能计算行业的一个关键拐点,目前尚没有哪家公司能够更好地帮助客户利用这一模式。
发布时间:2020-11-06 20:42        来源:赛迪网        作者:徐培炎

【赛迪网讯】突如其来的黑天鹅事件,在2020年爆发。本次事件不得不让全世界的每一个人为之关注,甚至是震撼。不管是传统的生产制造,还是现代的科学技术,甚至是金融、医疗等等,乃至全行业都受到了新冠疫情的影响。然而,就在这一轮黑天鹅事件中,更加让人们感受到了科技的力量。

在这一次疫情当中,可以清楚地看到,不管是疫情的防控也好,还是疫苗的开发也好,都与科技相关,都是通过科学技术手段来实现的,而且高性能计算在此过程中做出的贡献,更是不可小觑。为抗击疫情,英特尔投资5000万美金,成立了一个应对疫情的技术响应计划。

英特尔公司数据平台集团副总裁、高性能计算事业部总经理TrishDamkroger

英特尔数据平台集团副总裁、高性能计算总经理Trish Damkroger,在HPC China 2020期间,线上接受采访时表示:“英特尔希望和业界的合作伙伴和客户一起,为疫情本身做大量的贡献。用科技的方式,用超算的能力,与客户、政府研究人员以及其他的业界领先的组织,一起对抗病患,并且进行药物和疫苗的开发。”

Trish Damkroger认为,高性能计算会成为一个基本工具,这一点在疫情当中尤为凸显。高性能计算和人工智能的融合是高性能计算行业的一个关键拐点,目前尚没有哪家公司能够更好地帮助客户利用这一模式。英特尔® 至强® 可扩展处理器是唯一一款针对高性能计算和人工智能融合进行优化的数据中心 CPU——通过 AVX512 向量 SIMD 扩展来加速高性能计算应用,通过英特尔® 深度学习加速(英特尔® DL Boost)技术来加速人工智能应用——尤其是 VNNI 指令集,能让现有 Cascade Lake 处理器中的推理应用更快一步。Cascade Lake 处理器支持英特尔® 傲腾™ 持久内存,可加速数据分析和 AI 应用,同时推动高性能计算系统的加速检查点和启动等关键功能。

据Trish Damkroger透露,英特尔即将推出首款 10nm Ice Lake 服务器 CPU,并计划于 2021 年推出的Sapphire Rapids,会新增名为高级矩阵扩展(AMX)的加速器。

高性能计算与医疗

人工智能正被整合到高性能计算工作流当中,以加速模式检测,在某些情况下,比如 CERN,人工智能模型正完全取代基于物理学的模型。人工智能也在为个性化医疗等领域的高性能计算仿真提供加速。在上海瑞金医院,研究人员正利用机器学习算法来预测患者的个体风险,并能够更准确、更精确地识别哪些患者将从特定疗法中获得最大受益。这项研究是“转化医学国家重大科技基础设施(上海)” 这一重大计划的一部分,将为上海打造一个综合转化医学中心,囊括疾病预防、早期诊断和个性化治疗的模型与方法,解决重大疾病的发生、发展和复发等重大科学问题,促进高端医疗产业技术的研发。英特尔正与瑞金开展合作,利用英特尔® 至强® 处理器和英特尔® 傲腾™ 内存为其构建高性能计算和人工智能基础设施。

在连线采访中,上海瑞金医院大数据平台负责人吕纲表示:“将英特尔傲腾技术和AI的先进技术,应用到医学的研究和临床上面来,是一件非常有意义的事,而且在疫情期间,瑞金医院国家转化医学中心发挥了很大的作用。”

吕纲介绍,从架构上,瑞金医院采用了英特尔傲腾的内存产品,也在尝试使用DAOS这个分布式文件系统,把AI和一些组学计算的应用都部署到上面去,通过它对数据的加速来提升项目的运行效率。

高性能计算与高校

其实,高性能计算作为数字时代算力的核心支撑,不仅在医疗、金融、生产、制造等核心领域有特殊的表现,而且在各大高校也被尤为关注。南京大学人工微结构科学与协作创新中心的e-Science中心,主要目标就是为中心和全校的教学科研服务,这当中就包括高性能计算。南京大学人工微结构科学与协作创新中心姚舸,连线采访时表示“在高性能计算方面,e-Science中心大面积使用了英特尔的CPU、SSD以及网络产品(OPA),应该说现在有600多个节点来支撑整个协同创新的计算的需求。”

姚舸介绍,南京大学和其他高校的超算中心不太一样,是由课题组和中心公共的不同品牌、不同架构的机器组成的统一命名空间,单一的集群,这样所有的用户都可以在里面用自己的机器或者是其他的机器,基本上市面上能见到的品牌,在这个集群里都有在使用。

高性能计算与平台

北京东方超算科技有限公司CEO白洋,接受连线采访时表示“东方超算本身不造CPU,也不生产服务器,主要的业务是做基于英特尔最新技术的超算的整机解决方案。充分运用英特尔的AEP、S9200WK以及一些其他的新技术为用户提供高性能计算服务。”

除了校级高性能计算,或者是整合校级高性能计算,还有国家级高性能计算、地方高性能计算平台,当然近两年也有一些新兴的商业高性能计算平台,比如说东方超算运营的“超级大脑”,也有并行科技运行的“超算云平台”。

白洋指出,从市场细领域来看,有叫“尖端超算”,像国家级超算,“天河1号”、“天河2号”、“太湖之光”这样的尖端超算,跑一些国家战略级的应用。还有一个是通用超算,像校级超算,地方上的一些超算以及国家级超算的日常用户都是属于通用超算。也就是说,不管是计算材料还是化学还是流体,都可以在东方超算一套超算平台上很好的运行。

高性能计算与产品

浪潮集团AI&HPC副总经理赵帅,接受连线采访时表示:“建超算并不是最难的,用好超算反而是最难的。大家都在提中国前几年的超算系统重点还是以建为主,建起来之后再等应用。未来要建的超算其实是为了某个特定的应用去建设超算系统,将超算系统的利用效率提升起来,让它创造更大的价值,这才是建设超算系统的初衷。”

浪潮之所以和国内的高校、科研机构合作比较紧密,是因为这些高校和科研机构才是使用超算的主力军,因为有大量的学者,大量的研究型的人才,也有大量的想法和思路,能够让超算系统成为很好的工具。赵帅强调,随着浪潮和英特尔的合作越来越深入,无论是最早的Sky Lake,到Cascade Lake,以及Cascade Lake Refresh,以及现在跟英特尔合作的AEP内存,也包括跟英特尔在合作基于Altera FPGA的推广,让浪潮在促进数据中心高性能计算各个领域当中的高速发展有了一席之地。

小结

在此次新冠疫情爆发期间,高性能计算在社会中发挥的作用和重要性比以往更为明显。事实证明,科技是让社会各界延续正常生活的重要工具。面临当前日益丰富的人工智能使用场景,将我们推向计算智能进一步强化的新时代,模式的变革推动着人工智能和高性能计算工作负载的融合。英特尔正与客户、合作伙伴以及政府机构合作,发掘无可匹敌的生态系统之潜力,不仅是在抗击疫情方面,在整个高性能计算发展方面也做出了非凡的贡献。英特尔,任重道远!(文/ 徐培炎)

每日必读

专题访谈

合作站点