EEJournal

专题文章
现在就订阅

英特尔的豪赌oneAPI和DPC + +并行处理和异构计算:英特尔的采访詹姆斯Reinders

英特尔将许多大押注半导体过程改进,建设新的工厂和世界各地的制造工厂,新的包装技术,甚至软件。其中的一个赌注,或者一群押注,是oneAPI和数据并行c++ (DPC + +),是一个开放的、cross-architecture编程模型,让开发人员使用一个代码库跨多个体系结构和并行编程的基于Khronos SYCL C / c++。这些赌注是为了让软件开发人员更容易创建相对基于异构计算系统架构可移植代码。

詹姆斯Reinders最近四年后返回英特尔缺席。他以前花了27年在英特尔和大量的并行处理的经验。他是这本书的作者名为“数据并行c++:掌握DPC + +编程的使用c++和SYCL异构系统”,您可以通过点击免费下载链接。

最近,我花了一个小时的面试Reinders涉及广泛的话题。这是他的观点的编辑版本一组选定的主题相关的并行处理和异构计算。

一个oneAPI SYCL:

“oneAPI和SYCL基本工具,共享的愿景加速计算基于开放规范和开放的项目。oneAPI和SYCL必须服务于多个供应商和多个架构的需求。不只是一个厂商的需求。不仅gpu, cpu或fpga。工具需要最大限度地开放,我们可以找出如何让他们打开,因为这些语言和编程环境给你一个高性能的基础你所做的一切。”

在Python和C / c++或DPC + + oneAPI

“Python在很大程度上是用C语言编写关键库也用C编写的,所以不是你忽略Python在开发oneAPI。如果你得到正确的基础,其他好的事情发生。OneAPI说,“嘿,C或c++语言并不是整个世界。你需要的库。你需要的工具。你需要其他语言。“所以oneAPI是一种全面的名字不仅仅是语言,但对于其余的一切你需要开发软件为异构计算。”

约翰轩尼诗和大卫·帕特森的“计算机”的黄金时代

“约翰轩尼诗和大卫·帕特森是我们行业中的传奇。任何时候他们在公众场合说在过去的四年里,他们会讨论一个新的黄金时代的计算机体系结构。版本我通常指向最是ACM的他们把条通信在2019年初,他们做了大量的工作讨论计算机体系结构的发展随着时间的推移,他们最终答案。他们说我们正在进入一个新的黄金时代的计算机体系结构专业,领域特定架构(员)正越来越多地用于工作负载和加速到每瓦获得更好的性能,这是一个驾驶关心的一些问题。OneAPI设计处理这些地区体育会在一个统一的编程环境。”

在Chiplets UCIe:

“如果你看看英特尔的投资组合,我们有各种各样的加速能力。我们把专业硬件加速器在相同的死与我们的处理器。我们有gpu。我们有fpga。我们有高迪,优化深度学习。我们有区块链asic和我们有研究项目包括神经形态计算和图形,这是英特尔。你进入更广泛的行业,你可以看到更多的多样性。

“真正能让我领悟到这一切的是即将使用UCIe,通用Chiplet互连表达。你知道,以前我们作为PCIe卡插入不同的功能包括电脑声卡和一些早期的图形加速器。他们的想法是,如果你想有一个加速器或者进行一个专门的函数,即使一个声卡,你把它放在一个主板插槽。

“现在的问题是当你建立芯片,你做什么工作?没有插槽。我们的设计越来越多地多片设备由chiplets或瓷砖。(英特尔的顶级GPU)是由一个疯狂的旧桥,chiplets, 47个活跃的瓷砖。你如何让所有的瓷砖相互交流当他们来自不同供应商的?

“你可以规范他们如何相互交谈。有一个小的临时完成的。你知道,英特尔SKU前阵子我们配对与AMD处理器GPU的地方。显然,有人同意这些设备将如何相互交谈。这是一种自然的创建一个标准的理由。

“假设英特尔至强处理器使用本标准。一些其他的公司,也许创业,可以开发一个小chiplet非常具体做点什么吧。如果chiplet也采用这个标准,突然,创业公司可以要求英特尔的胶水的chiplet Xeon处理器在同一包中。然后您可以将扩充至强处理器放入一个标准的主板,你可以从戴尔或另一个供应商。这就是UCIe。

“这种能力有直接的好处。你不需要设计一个新系统或主板。你只是部署增强现有系统中CPU。

”然后,问题是,有多难软件进入这样一个系统吗?如果软件工具都准备这样的多供应商多架构,如果这些工具包括编译器、库,和性能分析工具,那么它就更容易开发软件这种增强的架构。软件的门槛降低。硬件的门槛下降因为搬到chiplets和采用标准chiplet互连。你进入市场的速度快得多。”

英特尔收购Codeplay

“公司Codeplay变得可用,英特尔决定收购他们。我感到兴奋不已。和我一起工作的人Codeplay,喜欢和他们一起工作。他们一直在做英伟达和AMD gpu一段时间,但作为一个商业公司,他们一直在寻找某人承销工作。客户想要的吗?一些实验室有时给他们种子资金,但并不足以完全productize他们的工作。我犹豫的说,“空白支票”,但从本质上说,他们现在有一个空白支票从英特尔productize他们的工作,他们不需要担心别人付钱。你应该从此次收购今年晚些时候看到结果。

“你将会看到他们的工具与英特尔的集成版本的SYCL这样SYCL / DPC + +最终能够目标所有gpu从英特尔、英伟达,和AMD。知道的人可以建立这类软件在去年使用开源工具。但是让我们面对现实吧,我们大多数人想要我们可以一样懒惰。我很喜欢能够与点击下载二进制文件,安装它,并让它工作,而不是建筑从开源文件和阅读大量的指令将文件转化为可用的工具。

“我们还将oneAPI社区的管理Codeplay,他们会把它变成industry-driven的东西。我们说这是行业驱动,但英特尔不得不把笔非常紧密的行业驱动它。现在Codeplay将运行显示帮助过渡到工业控制。

英特尔收购ArrayFire

“你知道,Codeplay雇佣了近100名工程师。ArrayFire有四个。因此,收购两家公司在这方面是不同的。但ArrayFire非常有才华的人,他们显然与公司,有着深厚的历史与技术。他们是真正的先驱。事实上,你可能已经看到了我把上周的小博客提及ArrayFire收购。(参见“ArrayFire团队加入英特尔oneAPI”)。

“当我遇到约翰(Melonakos ArrayFire)的CEO和创始人的前一周我发表了博客,我问他写一些关于收购,他写的是很谦逊的。我说,“哦,我的天哪!你们是先锋。我们需要比这更多的东西!“约翰同意,所以我添加了一些关于ArrayFire的话的开创性工作,因为我非常喜欢他们所做的事情。我们是超级兴奋的船上。

“你知道,人在ArrayFire开发了很多事情,最终成为并行在MATLAB工具包和相关工具。他们出售,或许可这些工具,然后创建了一个便携式图书馆GPU intrinsic真正易于使用。这些intrinsic只是运行在任何人的gpu。所以,他们解决问题的GPU,无需编写代码的编写代码Nvidia的CUDA,所以,软件开发人员可以利用任何人的GPU。一些研究人员在Facebook ArrayFire intrinsic开发代码用于机器学习和有很棒的加速效果。他们的代码执行比CUDA实现,这是一个真正的证明ArrayFire的家伙。他们真的知道如何优化GPU性能。任何GPU。”

未来的oneAPI

“我看到几大步骤发生oneAPI在未来几年。首先,我们必须证明oneAPI在英特尔工作。我们做得很好显示一个API是一个伟大的工作在我们的cpu和fpga。每个人的等待[支持](英特尔)GPU及其后继者旧桥。这是会发生的。生产一个新的架构总是痛苦的,无论我们多么说它不会。我已经通过这个几倍,所以我认为这将是非常令人兴奋的。我很兴奋将旧桥,做什么。

“但证明oneAPI真的满足了英特尔的需要和英特尔的客户需求是第一大挑战。下一个挑战是表明oneAPI适用于其他架构。所以我提到Codeplay,关于英伟达和AMD支持…在未来的几年中,你将看到一些有趣的结果发表。我们今年将发布更多的结果,但是在未来的几年中,我认为它会,它变成了一个共同的理解,oneAPI是可行的软件开发者针对多个来自多个供应商的体系结构。现在,有很多有趣的证据,与早期采用者出版了很多巧妙的论文在过去的几年里,展示积极的结果,但这是没有常识。我想在两年左右,它会成为常识。这是我的期望。

“这是高水平。oneAPI到底是什么?你会看到它在英特尔创新活动。移动oneAPI Codeplay开发和支持是下一步发展的标准。我认为生oneAPI英特尔做了伟大的工作,但现在它需要额外的帮助,所以英特尔需要放开一点。我帮助英特尔这样做,鼓励行业告诉我们最重要的指导oneAPI从这里向前。”

6思想”英特尔的豪赌oneAPI和DPC + +并行处理和异构计算:英特尔的采访詹姆斯Reinders”

  1. 就在几周前,我希望找到一个API确实是什么也没发现,是多么的伟大。没有肉的骨头,只是烟雾和镜子/一厢情愿,也许。

    因为什么都没有,我有基金的API。

    本文重点介绍加速器和GPU意味着处理数据。
    规则1:首先必须有数据,那么它就可以被处理。
    规则2:如果数据丢失,然后找到数据并使其可用。

    它从这里继续…

    1. 就在几周前,我希望找到一个API确实是什么也没发现,是多么的伟大。没有肉的骨头,只是烟雾和镜子/一厢情愿,也许。

      因为什么都没有,我有基金的API。

      本文重点介绍加速器和GPU意味着处理数据。
      规则1:首先必须有数据,那么它就可以被处理。
      规则2:如果数据丢失,然后找到数据并使其可用。

      它从这里继续…

      一个API与这些东西无关。它是程序的gpu和加速器已经在那里了。对不起的人。

留下一个回复

有特色的博客
2023年5月9日
在舒适的硅谷2023,我们举办了一个小组在芯片设计的人工智能,探索如何AI-enabled EDA工具简化SoC设计,加速验证等等。邮局什么在芯片设计的未来人工智能吗?第一次出现在芯片设计的新视野....
2023年5月8日
如果你计划去土耳其在不远的将来,然后我有一个忙问....
2023年5月8日
今年4月带来的两倍,台积电将其过程路线图,工厂建设规划,更在台积电技术研讨会。另一种是开放式创新平台生态系统论坛10月,通常简称为“OIP。”Dave...

有特色的视频

找出最好的定制设计工具刚刚好

节奏设计系统

模拟电路设计领域,我们知道的是进化。所以节奏的技术。学习如何最好的模拟工具刚更好帮助你跟上挑战性的设计问题。AI-powered大师工作室定制设计方案提供了创新的特性,重基础设施的效率,设计生成AI迁移,新级别的集成超出经典设计的界限。

点击这里获取更多信息

以注入式教学法亚博里的电子竞技

Multi-Connectivity资产跟踪的挑战
Multi-connectivity资产跟踪是现代供应链的关键因素。注入式教学法在这节课中,科林Ramra亚博里的电子竞技ttan和曼纽尔Cantone意法半导体和阿米莉亚道尔顿今天讨论资产跟踪所需的共同需要,为什么低功率处理是至关重要的对于这类应用程序,以及如何意法半导体阿斯特拉平台可以帮助你开始你的下一个资产跟踪设计。
2023年2月20日
10452的浏览量
Baidu