本篇文章1092字,读完约3分钟
周翔:人工智能时代的异构计算 2017年8月22日,在云计算发展与政策论坛和数据中心联盟的指导下,由开放数据中心委员会主办,由百度、腾讯、阿里巴巴、中国电信、中国移动、中国信息与通信研究院和英特尔主办的2017年ODCC开放数据中心峰会在北京隆重举行。在下午的服务器分论坛上,云计算和英特尔中国数据中心集团高级技术总监周祥就人工智能时代的异构计算做了精彩的演讲。 2017年8月22日,开放委员会在北京举办了由百度、腾讯、阿里巴巴、中国电信、中国移动、中国信息与通信研究院和英特尔主办的“2017 ODCC开放数据中心峰会”。在下午的服务器分论坛上,英特尔中国数据中心集团高级技术总监周祥就人工智能时代的异构计算做了精彩的演讲。
在培训方面,英特尔上月发布了最新的至强服务器处理器。至强融核产品也可用于加速训练。在网关方面,英特尔也在布局方面做出了巨大努力,包括电影产品和现场可编程门阵列。在过去的几年里,人工智能有了很大的发展。数据中心中人工智能的快速发展得益于智能端带给数据中心的数据,这使得每个人都有能力挖掘这些数据。英特尔认为,下一个趋势是将数据中心产生的智能应用到底。具体应用可以是自动驾驶、机器人或各种辅助服务。因此,英特尔最终也有很大的投资,包括VPU电影,包括FPGA,包括GNA(IP)。在人工智能中,除了数据中心,我们还非常重视终端。我们坚信,从云到设备端,会形成一个有机的闭环,以补充彼此的增长。
具体来说,在数据中心方面,英特尔一直在提高其在至强等服务器上的处理能力。例如,在至强处理器中,我们在最新一代至强处理器中增加了一个加速单元,如AVX512。外面的展位上有一个展览。如果打开AVX512进行冲击加速,当前的冲击效果可以大大提高。第二个是深度学习,KNM产品的单精度浮点单元数量已经翻了两番。我必须提到上面的一点。当在训练中使用一些传统的工具时,例如,当处理大图片时,首先要做的是使图片变小。当你把它们放在GPU卡上进行加速处理时,它的内存容量可能不够,它的带宽可能有限,所以它只能处理小批量。然而,英特尔的KNL/KNM处理器基于其大内存容量和带宽,可以使用大批量,从而有效地加速大矩阵运算。此外,我想提一下FPGA,它带来了较低的执行效率和能耗。英特尔的现场可编程门阵列解决方案可以提高训练/推理的效率,并降低能耗开销。
我们还有一个专用于培训的专用集成电路,将于2017年下半年推出,以加速深度学习。
从云到设备,英特尔正在加强人工智能服务。从AVX现有的至强产品,或KNM加速器卡,FPGS或专用集成电路,我们有一套完整的解决方案。
谢谢大家。
标题:周翔:人工智能时代的异构计算
地址:http://www.yunqingbao.cn/yqbxx/1387.html