EEJournal

专题文章
现在就订阅

机器学习:1092年世界语诱使RISC-V处理器跳舞的头销,er的筹码

这是戴夫Ditzel大,还是历史会重演吗?

戴夫Ditzel有着传奇的历史与计算和微处理器。他加入AT&T贝尔实验室从事C语言开发。在那里,他开发了几代的处理器设计执行优化编译C程序包括脆,贝尔实验室的“C语言精简指令集处理器”。

在贝尔实验室,Ditzel也是基本RISC文档合著,“精简指令集计算机,”加州大学伯克利分校的教授大卫·帕特森。Ditzel然后加入太阳微系统公司的首席技术官SPARC技术业务,在那里他领导SPARC RISC处理器体系结构的发展和64位SPARC ISA。甲骨文收购太阳微系统公司2010年,后来在2016年停产企业SPARC开发。但由于SPARC国际SPARC ISA的继续,完全开放,非专有、免版税的IP。

Ditzel微处理器制造商成立1995年全美达发展的意图VLIW(很长的指令字)处理器,完全仿真x86 ISA使用动态二进制转换软件。这个软件包装x86指令转换为VLIW机器指令。Transmeta推出的第一个产品,鲁滨逊处理器,一场精心策划的新闻发布会在山上的别墅蒙塔沃艺术中心托尼•萨拉托加2000年1月19日,加州。我在那里的媒体。

Transmeta定位鲁滨逊作为一种低功耗替代x86 Intel和AMD的产品轻薄的笔记本电脑和其他移动设备。最初,这个公司的处理器销售前景看好。似乎Transmeta雕刻了一个看似保护利基-低功率电池供电的设备的x86处理器,AMD和英特尔相互纠缠在高性能、大功率x86前面。

但鲁滨逊的销售和新闻报道让英特尔如何拼命的轻薄笔记本电脑和移动市场想要一个低功耗的x86微处理器。英特尔然后迅速填补Transmeta-sized空白的x86处理器产品线的“差强人意”降低功率模收缩奔腾III处理器,被称为奔腾3。英特尔很快跟着奔腾3与奔腾M处理器的“M”当然“移动”。

Transmeta鲁滨逊处理器微温的应用程序的性能,所以Transmeta VLIW指令宽度从128年到256年增加了一倍位为其第二代Efficeon处理器,运行x86代码比鲁滨逊快。然而,与此同时,双Transmeta切换铸造厂和随后陷入困境的交货时间。到2007年,该公司已经改变了业务模式,知识产权许可。全美达2009年,收购和操作关闭之后。退出Transmeta处理器的战争。Sic交通格洛里亚的描摹。

所有这些都是序言,证明戴夫Ditzel微处理器并不陌生,想大,跳出框框思考好。他最新的风险是世界语技术,他仍然是微处理器框以外的操作方式。

Ditzel呈现的细节世界语ET-SoC-1毫升(机器学习)推理的芯片在8月份热芯片33。这个芯片完全显示Ditzel长与RISC处理器。ET-SoC-1毫升推理引擎包含1092(“一千零九十二”)定制,64位RISC-V微处理器核心,160 mb的片上存储器,和各种I / O端口-所有在一个7海里死了。

“野心”是这个芯片设计一个低调的词。

顾名思义,ET-SoC-1毫升推理芯片旨在提供优越的能力/性能结果在执行毫升推理工作负载。它通过经济和逻辑电路设计和专业,低压供电设计技术。

1092年RISC-V ET-SoC-1毫升芯片处理器核心,1088核是世界语的“外星人的奴才”核心,一个明显的参考大量可爱,忠诚,黄皮肤工蜂系列动画《卑鄙的我》的电影。ET娇美的核心是基于开放的64位RISC-V ISA,专有的矢量和张量指令扩展专为毫升开发的应用程序。这些ISA扩展支持单个钟操作浮点矢量和张量多达256位使用16或32位操作数,使用8位和512位的整数数据操作数。

图1所示的布局等奴才核心。如图1所示,向量/张量单位小矮人附加64位RISC-V整数控制器的核心:

图1:世界语的ET奴才处理器内核增强RISC-V处理器与张量/矢量单位RISC-V超过两倍的整数单元。

通常这样的向量/张量单位将会设计成CPU-hosted加速器,不是直接集成到一个微处理器IP核心。谷歌TPU(张量处理单元)就是这样的一个例子加速器。

一旦世界语发达等奴才核心,其余ET-SoC-1毫升推理芯片的设计成为一个分步重复练习。(是的,我刚刚做了一个粗略的简化,和你将看到为什么)。第一个分步骤重复操作组ET奴才的八核和32 k字节的指令缓存共享社区,“见图2。

图2:8等奴才处理器核心和32 k字节的指令缓存共享RAM组成一个ET-SoC-1毫升推理芯片“邻居”。

四个8核ET-Minion社区然后连接到四片上,1兆字节存储器银行通过一个4×4交叉点开关连接起来,形成一个“奴才夏尔。”(世界语命名委员会必须成为了这些名字)。一个奴才夏尔框图出现在图3。

图3:四个社区四个下SRAM银行和NoC接口构成的奴才夏尔ET-SoC-1毫升推理引擎。

的奴才夏尔四1兆字节存储器银行可以配置缓存或便条簿RAM,取决于毫升的应用程序的需要。四个SRAM银行也连接到一个“网停止,”这是奴才夏尔的匝道ET-SoC-1毫升推理引擎的内部NoC芯片(网络)。

全部ET-SoC-1毫升推理引擎死布局由34个奴才郡,与一些额外的夏尔类型包括夏尔,包含四个高性能世界语Maxion处理器核心(也基于RISC-V处理器核心),八个内存郡(每个都包含一个LPDDR4 SDRAM控制器),和作为PCIe夏尔。所有郡合并网格通过NoC停止和相互通信。图4提供了一个图的整个ET-SoC-1毫升推理引擎死布局。

图4:整个ET-SoC-1毫升推理引擎由34个奴才郡、四核等Maxion处理器夏尔,8的记忆郡LPDDR4 SDRAM控制器,作为PCIe夏尔。

世界语设计ET-SoC-1毫升推理引擎的120 w功率预算。预算是基于的可开源冰川点v2,设计开放计算项目的约塞米蒂v2下一代多节点服务器平台。世界语设计了一个双M.2模块插入到冰川点v2。这种双重M.2模块结合与24 LPDDR4 ET-SoC-1毫升推理引擎更快。冰川v2董事会可以接受这些双重M.2多达六个模块,创建一个插件服务器卡6558 RISC-V核心(奴才和Maxion核)和192 gb的LPDDR4 SDRAM。

有六个ET-SoC-1毫升推理引擎芯片和相关SDRAM, 120 w功率预算工作,每双20 w M.2卡。世界语需要等级低功耗功能合并到等奴才核心,社区,郡,NoC,补习6000多个处理器核心和相关LPDDR4 SDRAM冰川内点V2董事会120 w功率信封。

给定的目标架构大规模并行推理引擎ET-SoC-1毫升、世界语分析时钟频率之间的关系和依赖性,核心电源电压,应用程序性能找到一组最优的1088 ET的奴才处理器核心推理引擎死。结果/表现/电压曲线出现在图5中,这表明,ET奴才处理器核心需要运行在大约0.4 V提供最高性能,同时满足冰川点双M.2卡20 W的电力的目标。(这个数字包括的运行功率LPDDR4更快)。

图5:广泛的分析表明,ET-SoC-1毫升推理引擎将达到20 w功率预算由1088芯片上运行等奴才处理器核心约0.4 V。

33热芯片的演讲中,Ditzel指出,核心工作电压0.4 V是甚至亚阈值和阈晶体管与目标7纳米加工技术。他声称,因此在0.4 V操作电压的原因。

根据其分析,世界语声称ET-SoC-1毫升推理引擎达到每瓦123 x更好的性能在MLPerf深度学习推荐模型基准相比,Intel Xeon铂8380 h处理器和每瓦25.7 x更好的性能在ResNet 50基准相比,Intel Xeon铂9282。这些特殊的Xeon处理器,英特尔宣布在Q2,分别为2020和Q2, 2019人。他们不代表最新英特尔至强硅,所以这些世界语声称的盐瓶。

Ditzel基准的数字都是理论的时候热芯片33表示因为世界语刚刚收到第一个硅ET-SoC-1毫升从铸造推理引擎,还没有来得及让芯片工作。这就是营销的基准对比模拟处理器和真正的硅。这将是非常有趣的,看看,多么现实赶上世界语的模拟数据。

它也将是有趣的,看看戴夫Ditzel历史重演。他曾经调整英特尔与低功耗的鼻子Transmeta鲁滨逊x86处理器。英特尔积极回应针对其处理器市场明显而现实的危险,因此,Transmeta没有更多。世界语ET-SoC-1 ML推理引擎玩另一个低功耗的游戏在不同的块英特尔的市场地盘——数据中心——这也是目前被反对团队从AMD,英伟达,Xilinx,谷歌云,亚马逊网络服务,和几毫升的竞争者,除了英特尔。

这将是相当的战斗。我们会看,看看会发生什么。

一个思想“机器学习:世界语唱红脸1092 RISC-V处理器跳舞的头销,er芯片”

留下一个回复

有特色的博客
2023年2月7日
DesignCon期间有两个主题演讲,一本古,节奏的系统分析业务的副总裁,另一个波士顿动力公司的德文·比林斯,本周晚些时候,我将涵盖。实际上有一个第三,本教程前一天适当的会议上,但是……
2023年2月7日
我们探讨AI-powered EDA工具图表芯片设计和验证的新课程,DSO。人工智能芯片设计工具级距tapeouts 100年首次生产。后为AI在芯片设计生产新课程首先出现在从硅到软件....
2023年1月30日
Hossam Sarhan工作更聪明,而不是更辛苦。不是每个人都总是告诉你什么?当然,优秀的建议,……
2023年1月19日
你有问题调整表带或交换你的手表电池吗?如果是这样的话,我很高兴消息的信使....

以注入式教学法亚博里的电子竞技

信号的过街天桥系统下创速度

Samtec

的需求越来越高连接速度的增加,我们需要看看我们的互连解决方案来帮助解决固有的设计要求与这些类型的设计。注入式教学法在这节课中,阿米莉亚道尔顿亚博里的电子竞技和马修·伯恩斯Samtec讨论Samtec立交桥技术如何帮助解决我们的高速连接需求。他们仔细看看Samtec立交桥技术如何帮助解决问题PCB,立交桥的细节®QSFP系统,以及这如何有效成本,高性能和热高效能帮助你的挑战56 Gbps带宽和超出设计。

点击这里获取更多信息信号立交桥下创®系统速度

Baidu