一种基于百度云异构多核平台的深度调频加速算法

 

概述

基于百度云异构多核平台设计了一种深度调频加速算法,该平台包含Intel的E5-2650 v4 CPU和Xilinx的XCKU115 FPGA。

1)首先使用百度的开源深度学习框架paddleblade对模型进行训练。

2)为了更好地理解模型的工作原理,使用c++对整个系统进行了重构,包括预处理过程、参数提取和模型重构。

3)根据重构后的系统对计算任务进行分割。只有完全连接的层通过使用百度的Polaris API实现来加速,该API有助于使用FPGA加速程序。

4)尽可能充分利用DMA带宽,使用Polaris API保证结果正确。

5)最后但并非最不重要的是,我们算法的性能比在配备英特尔i5-3470 CPU的PC上运行的原始版本大约好4倍,不考虑DMA消耗的时间。我们算法的性能是原始版本的2倍以上,包括DMA时间。

 

 

62

系统架构

 

63

算法框架

 

2019年8月21日 22:48
浏览量:0
点赞
首页    Catalog    2018 OpenHW    一种基于百度云异构多核平台的深度调频加速算法