AET原创

Speedcore eFPGA定制模块提升大数据处理效率

于寅虎 2017/11/29 10:23:00

随着新一波智能数据密集型应用的兴起,基于传统的CPU架构已经无法满足这些新应用中计算需求的指数级增长,推动了对全新的、异构的、带有可编程硬件加速器的计算架构的需求。

人工智能(AI)/机器学习、5G移动通信、汽车先进驾驶员辅助系统(ADAS)、数据中心和网络应用,催生了包括地平线机器人、寒武纪、商汤科技等以提供高性能ASIC为核心产品的公司,而这些高性能计算的ASIC产品对于传统的FPGA 的发展提出了挑战。

COO.jpg

Achronix Semiconductor市场营销副总裁Steve Mensor

FPGA技术在寻求新的发展空间,嵌入到大规模专用处理芯片是一个新的方向。

Achronix是一家私有的、采用无晶圆厂模式的FPGA 技术公司,开发了自己的嵌入式FPGA技术,该技术是Speedster22i  FPGA及Speedcore eFPGA产品的基础。

为了进一步推广自己独特的 FPGA技术,Achronix日前宣布为其eFPGA IP解决方案推出Speedcore custom blocks定制单元块。

speedcore1.jpg

据Achronix Semiconductor市场营销副总裁Steve Mensor介绍, Speedcore eFGPA嵌入式FPGA可加速数据密集的,而 Speedcore custom blocks定制单元块可以大幅度地提升性能、功耗和面积效率,并支持以前在FPGA独立芯片上无法实现的功能。利用Speedcore custom blocks定制单元块,客户可以获得ASIC级的效率并同时保持FPGA的灵活性,从而带来了一种可以将功耗和面积降至最低、同时将数据流通量最大化的高效实现方式。

speedcore3.jpg

Steve Mensor表示,Speedcore eFPGA提供了性能最高而成本最低的硬件加速,而现在借助Speedcore custom blocks定制单元模块,过去在独立FPGA运算结构中运行缓慢且消耗大量资源的功能,都可以面向最高性能和最小片芯面积这些目标进行优化。

通过为矩阵乘法运算优化数字信号处理器(DSP)和存储单元块,基于卷积神经网络(CNN)的YOLO目标识别算法的芯片面积被缩减了超过40%。

 案例一.jpg

据Steve Mensor介绍,用Speedcore custom blocks定制单元块来实现,客户还获得了相当可喜的技术进步,包括:1、需要并行比较器阵列的大型字符串搜索功能的片芯面积可以缩减超过90%。;2、桶形移位器(Barrel shifter)和二进制位处理结构也可以在Speedcore custom blocks定制单元块中完全实现,从而在同样的面积中实现更大的、更精妙的应用,提升了可获得的频率;3、一个运行在800MHz的400Gbps包处理数据通道的核心功能也可以用Speedcore custom blocks定制单元块来实现,其可编程逻辑管理分析和控制功能。

Steve Mensor在演讲中还详细地介绍了Speedcore Custom Blocks定制单元块的定义过程。

定义过程1.jpg

Speedcore custom blocks定制单元块由Achronix与其客户共同定义,这需要一个详细的加速工作负载架构分析,作为性能和/或面积瓶颈的重复性功能被评估为潜在目标,有可能被硬化而进入Speedcore custom blocks定制单元块。

随后,Achronix将为客户提供一个用于基准测试和评估的新版ACE设计工具,它包含了带有定制单元块的、新的Speedcore eFPGA。根据需求,该过程可以被多次迭代,为客户的系统创建优化的解决方案。

在用户使用Speedcore custom blocks定制单元块进行产品开发时,ACE设计工具将会全程提供的支持。

在Achronix提供的的ACE设计工具里,每个Speedcore custom blocks定制单元块创建了一种独有图形化用户接口(GUI),它可以管理所有的配置规则。

Steve Mensor表示,ACE拥有Speedcore custom blocks定制单元块所有配置的完整的时序细节,支持ACE去完成各种设计基于时序的布局和布线。客户可以用强大的版图规划器来优化设计,并为所有的单元实例去制定局域或者定点的任务安排。

ACE还包括一个关键路径分析工具,它可以支持客户去分析时序。客户还可以使用ACE强大的Snapshot嵌入式逻辑分析仪,去创建复杂的触发器并展示Speedcore内的实时信号。

Achronix FPGA