×
×

433亿晶体管,1020万逻辑门,史上最大FPGA诞生!软件工程师也可轻松把握!

2019-11-07 12:12:22 源头:EETOP 原创

11月6日,英特尔在北京举行的FPGA技术日活动中,宣告了环球最大容量的全新FPGA:Stratix 10 GX 10M FPGA;同时宣告其革命性的开发工具-OneAPI,即将宣告测试版,让恳华发职员可同时把握CPU、FPGA、GPU、AI 四种了始终同芯片。

史上最大FPGA:433亿晶体管,1020万逻辑门

Stratix® 10 GX 10M FPGA是英特尔Stratix®10系列最新产物,产物正式宣告以前,已经有多家客户收到样片,当初该恳活FPGA已经正式量产!

英特尔 Stratix 10 GX 10MFPGA 具备1020 万个逻辑单元,集成了433亿个晶体管,其密度约为Stratix 10 GX 1SG280 FPGA 的 3.7 倍,后者为原英特尔 Stratix10 系列中元件密度最高的设置装备排列。

之以是可能做到云云之大,是由于其操纵英特尔独占的EMIB 封装技术,交融了两个高密度英特尔 Stratix 10 GX FPGA 焦点逻辑晶片(每一个晶片容量为 510 万个逻辑单元)以及相应的 I/O 单元(PCIe4.0、UPI互连单元等)。

英特尔的 EMIB 技术只是多项 IC 工艺技术、打造以及封装翻新中的一项,正是这些翻新的具备,让英特尔患上以构想、打造并交付当初天下上密度最高(代表计较才气)的FPGA。

把柄芯片内封装的了始终同功能的成果小芯片,Stratix 10系列FPGA包罗了SX、TX、MX、DX以及GX了始终同型号。

GX FPGA没有集成Arm Core,PCIe4反对软IP,最大收发器速率28.3Gbps,可能看到比拟更高功能的DX,GX定位于通用运用,弛缓被用于 ASICETTTT原型构想以及仿真。

ASIC原型构想以及仿真市场对于之后最大容量的FPGA需要非分分内争切。有数家提供商提供商用现成(COTS) ASIC原型构想以及仿真体系,对于这些提供商而言,可能将之后最大的FPGA 用于ASIC 仿真以及原型构想体系中,就象征着获患了庞大的相助优势。此外,包罗英特尔在内的了始终少大型半导体公司都开发了自界说原型构想以及仿真体系,并在流片前运用该体系来验证自身最大规、最庞大、危害最高的ASSP 以及SoC 构想。ASIC仿真以及原型构想体系可能帮手构想团队大幅起飞构想危害。因此,包罗英特尔 Stratix10 FPGA 以及更早的Stratix® III、StratixIV 以及Stratix V 设置装备排列在内的英特尔 FPGA,十多年来了始终停被用做了始终少仿真以及原型构想体系的底子设置装备排列。

ASIC 仿真以及原型构想体系反对了始终少与IC 以及体系开发干系的事变,包罗:

  • 运用着实硬件的算法开发
  • 芯片打造前的初期 SoC 软件开发
  • RTOS 验证
  • 针对于硬件以及软件的极度条件测试
  • 间断构想迭代的回归测试

仿真以及原型构想体系旨在帮手半导体厂商在芯片打造前候发现以及克服代价高昂的软硬件构想缺陷,从而节约数百万美元。芯片在打造实现后修复硬件构想缺陷的资源要高了始终少,通常须要低廉的重新构想用度。当设置装备排列打造进去并交付给终端客户,解决这些问题的资源甚至会更高。正由于危害云云之高,且有大概节约的用度云云之多,这些原型构想以及仿真体系为IC 构想团队带来了实着真正的代价。仿真以及原型构想体系的运用已经愈来愈遍布,由于在经济危害云云之高的状况下,没有哪个构想团队担当人敢于轻忽这项审慎的验证性投资。运用最大型的FPGA,就可以够在尽大概少的FPGA 设置装备排列中纳入大型ASIC、ASSP以及SoC 构想。英特尔 Stratix10 GX 10M FPGA是用于词攀类运用的一系列大型FPGA 系列中的最新设置装备排列。该恳活全新的英特尔 Stratix10 FPGA 反对仿真以及原型构想体系的开发,实用于耗用亿级ASIC 门的数字IC 构想。包罗1020 万个逻辑单元的英特尔 Stratix10 GX 10M FPGA,现已经反对英特尔®Quartus® Prime 软件套件。该套件接收新款专用IP,明了反对ASIC 仿真以及原型构想。

英特尔 Stratix10 GX 10M FPGA 是第一款运用EMIB 技术并在逻辑以及电气上将两个FPGA 构造晶片结合到一起的英特尔 FPGA,实现高达 1020 万个逻辑单元密度。在该设置装备排列上,数万个毗邻通过历程多颗EMIB 将两个FPGA 构造晶片举行毗邻,从而在两个单片FPGA 构造晶片之间造成高带宽毗邻。以前,英特尔运用了 EMIB 技术将 I/O 以及内存单元毗邻到 FPGA 构造晶片,从而实现了了英特尔 Stratix10 FPGA 家属的范畴以及种类了始终时扩展。譬如,英特尔 Stratix10 MX 设置装备排列集成了8 GB 或者16 GB的EMIB 相连的3D 重叠HBM2 SRAM 单元。近来宣告的英特尔 Stratix10 DX FPGA 则集成了EMIB 相连的P tile,具备PCIe 4.0 兼容才气。(英特尔首款反对硬核PCIe Gen4 及超路径互连(UPI)FPGA量产出货!<span style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important; color: rgb(51, 51, 51); font-family: -apple-system-font, BlinkMacSystemFont, " helvetica="" neue",="" "pingfang="" sc",="" "hiragino="" sans="" gb",="" "microsoft="" yahei="" ui",="" yahei",="" arial,="" sans-serif;="" font-style:="" normal;="" font-variant-ligatures:="" font-variant-caps:="" font-weight:="" 400;="" letter-spacing:="" 0.544px;="" orphans:="" 2;="" text-align:="" justify;="" text-indent:="" 0px;="" text-transform:="" none;="" white-space:="" widows:="" word-spacing:="" -webkit-text-stroke-width:="" background-color:="" rgb(255,="" 255,="" 255);="" text-decoration-style:="" initial;="" text-decoration-color:="" font-size:="" 12px;"="">)

英特尔 Stratix10 DX FPGA 中运用的P tile是兼容PCIe 4.0 的PCI-SIG 体系集成设置装备排列清单中的首款组件级设置装备排列。近来宣告的英特尔®Agilex™ FPGA 中也同样慎浓厚成了同款P tile,于是也能兼容PCIe 4.0 设置装备排列。英特尔 Stratix10 DX 以及英特尔 AgilexFPGA 中运用的P tile是这一运用的又一绝佳榜样,它展示了诸如EMIB的后退先辈打造以及生产技术,以及如何让英特尔将一系列新产物倏地推向市场,并投入片面生产。大概更弛缓的是,用来打造英特尔 Stratix10 GX 10M FPGA 的半导体以及封装技术,着实非但仅是为了打造天下上最大型的FPGA,这只是一个附加值,尽管相称弛缓,但着实了始终是最重点。

oneAPI 即将宣告测试版本,软件工程师也可以轻松把握FPGA

在明天的活动日上,英特尔逻辑奇迹部副总裁宣告oneAPI将于11月下旬宣告测试版。

早在去年12月,英特尔就推出了“oneAPI”,顾名思义,“oneAPI”的目的便是提供对抗的编程模子,简化在了始终同硬件架构上的AI法式开发事变,让恳华发者用一探杓码构建实用于了始终同硬件的AI运用法式。

英特尔的产物包围的遍布计较架构包罗标量(Scalar)、矢量(Vector)、矩阵(Matrix)以及空间(Spatial),拆散弛缓运用于CPU、GPU、AI减速器以及FPGA产物。英特尔指出,在接下来五到十年中最弛缓的当代事变负载,便是这种标量、矢量、矩阵以及空间架构的组合,英特尔称之为SVMS架构。英特尔的oneAPI,即是从软件层面来简化以及对抗跨SVMS架构的翻新。

通过历程oneAPI,工程师将可能接收oneAPI所反对的并行C++语言,对于这四种芯片举行编程,特殊是对于FPGA来讲,当初软件工程师也可以轻松实现构想了。

会后英特尔FPGA以及电源产物营销总裁Patrick Dorsey向EETOP记者正文道:oneAPI开发FPGA主如果接收并行C++语言来实现算法库的挪用,这样会大大减速FPGA的开发时间,然而功能比拟直接用RTL语言开发的要弱一些,约莫相称于70~80%。

 

关于oneAPI的更多补充

英特尔oneAPI概览

  • 以数据为中心的多元化计较事变负载鞭策着对于多元化计较架构的需要,包罗 CPU、GPU、FPGA 以及 AI 减速器。
  • 多元化计较架构包围标量(Scalar)、矢量(Vector)、矩阵(Matrix)以及空间(Spatial)。这种在英特尔缩写为SVMS的架构,须要一个高效的软件编程工具来空虚监禁其功能。
  • oneAPI跨SVMS架构对抗并简化了编程模子,为开发者带来更高的生产效力以及绝了始终退让的功能。
  • oneAPI基于英特尔的当先软件产物以及丰厚的SVMS架构专长打造,作为一套实用的解决办理,其底层接口已经被宽泛的软件生态体系接收。
  • oneAPI以行业尺度以及凋谢范例为底子,鼓舞鼓舞生态体系协作以及配合翻新。

英特尔oneAPI样式细节

  • oneAPI反对直接编程以及API编程,并将提供对抗的语言以及库,可能在包罗CPU、GPU、FPGA以及AI减速器平了始终同硬件上,提供完备确当地代码功能。
  • 直接编程:oneAPI包罗一个全新的直接编程语言Data Parallel C++ (DPC++),这是一个可调换单架构专用语言的凋谢式、跨行业的编程语言。通过历程运用恳华发者熟习的编程模子,DPC++可能供应并行编程的效力以及功能。
  • 基于API的编程:oneAPI壮大的库超过多个可受益于减速的事变负载范畴?夂攵杂诿恳桓鲋副昙芄苟季傩辛硕ㄖ票嗦。
  • 综合与调试工具:在当先的综合工具的底子上,英特尔将提供增强版的综合与调试工具,以反对DPC++以及遍布的SVMS架构。

直接编程语言Data Parallel C++

  • 多元化架构须要全新的编程语言,现有的C++、MATLAB等可移植编程语言以及CUDA、OpenCL等数据并行编程语言,都无奈餍足需要。
  • 英特尔正在与行业连袂开发一种全新的语言,反对实现高出SVMS架构的数据并行编程。
  • DPC++语言可能跨SVMS架构为英特尔以及行业提供绝了始终退让的高功能以及生产效力。
  • DPC++是一种基于尺度的凋谢式跨行业语言,可调换繁多架构专有语言。

高功能恳烩鞭策人工智能以及数据综合的成长

  • oneAPI集成了业内顶级的计较库,包罗最倏地、运用最遍布的数学函数库MKL、运用榜样板滞学习算法的英特尔数据综合减速库DAAL,以及面向深度神经收集的英特尔数学焦点函数库MKL-DNN等,空虚体会底层硬件如CPU以及减速器的整个细节,并为硬件提供最佳功能。
  • oneAPI面向数据迷信家以及运用恳华发者提供跨SVMS架构的对抗软件形象,让整个开发者可随时得到高功能。
  • OpenVINO展示了oneAPI愿景的现实。作为为客户解决问题的优化推理引擎,OpenVINO补充了深度学习框架,反对运用法式开发者以对抗接口跨SVMS架构举行开发。
  • 英特尔软件产物及工具已经遍布运用于现实的深度学习客户排列。

整个批判

X