下载此文档

基于HLS工具的CNN加速器的设计与优化方法研究.pdf


文档分类:通信/电子 | 页数:约5页 举报非法文档有奖
1/5
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/5 下载此文档
文档列表 文档介绍
万方数据
圆圆孤圆匝基于ぞ叩腃加速器的设计与优化方法研究木人工智能甌蟘榔粀..程佳风,王红亮鯽锱緈海琣’蚰篴件加速的开发研究,但由于籰矩阵切割的设计方法对卷积核运算进行优化。—和卷积神经网络斜贝笱У缱硬饬考际豕抑氐闶笛槭遥轿魈摘要:基于软硬件协同设计的思想,利用ぞ撸赑猌教ㄉ仙杓撇⑹迪至艘桓鼍砘窬缂铀倨鳎对卷积运算采用矩阵切割的优化方法,均衡了资源消耗和计算资源,使得加速器的性能达到了最优。利用据集对加速器核进行性能测试,实验结果表明:对单张图片的测试,该加速器相对于教ㄊ迪至.加速效果,对于磐计牟馐栽蚩纱锏.的加速效果,随着测试图片数量的不断增加,加速器的性能也将越来越优。关键词:卷积神经网络;—;ぞ撸患铀倨中图分类号:文献标识码:/甶中文引用格式:程佳风,王红亮.基于ぞ叩腃加速器的设计与优化方法研究【浚缱蛹际跤τ茫.鷇叩瑆珻蚰猌騜衐—肿;—;近年来,卷积神经网络的应用范围越来越广泛,其应用场景也日益复杂,卷积神经网络的计算密集和存储密集特征日益凸显,成为快速高效实现卷积神经网络的限制。于是基于】的不同的加速器平台被相继提出以提升纳杓菩阅堋的电力消耗巨大,硬件结构固定,限制了卷积神经网络在嵌入式设备的应用;开发成本极高,灵活性低,不适合搭载复杂多变的卷积神经网络;具有功耗低、性能高、灵活性好的特点,因此更加适用于卷积神经网络硬7⒚偶鞲撸发周期相对较长,影响了在卷积神经网络应用的普及【!俊本文基于软硬件协同的思想,利用ぞ撸—上实现了一个卷积神经网络加速器,并采用本设计采用公司推出的—开发板作为实验平台。—【“渴腔赬俊綵的平台,除继承了传统平台的强大处理性能外,还兼容涌谟氡曜际鬏山涌冢馐沟—具有极大的可拓展性与开源性。是一个新的开源框架,使嵌入式编程人员无需设计可编程逻辑电路即可充分发挥綵英文引用格式:綣】.:—,.限:鮡琋琓—,Ⅱ【阳.籩篺,血眨甧.趖,篶;鹣钅浚荷轿魇 こ獭敝氐阊Э平ㄉ杓苹钅瑂
万方数据
一——旁裁笏赌国熟困人工智能《电子技术应用》年第卷第谝低成杓朴胧迪表绮问墓δ堋S氤9娣绞讲煌氖牵ü齈猌用户可以使用进行喑蹋⑶掖肟芍苯在辖锌7⒑筒馐浴Mü齈獄杀喑搪辑电路将作为硬件库导入并通过其斜喑蹋浞式与导入和编程软件库基本相同。卷积神经网络【‘】是一种复杂的多层神经网络,擅长处理目标检测、目标识别等相关的深度学习问题。卷积神经网络通过其特有的网络结构,对数据量庞大的图像识别问题不断地进行图像特征提取,最终使其能够被训练。一个最典型的卷积神经网络由卷积层、池化层、全连接层组成。其中卷积层与池化层配合,组成多个卷积组,逐层提取特征,最终通过全连接层完成图像的分类任务。卷积层完成的操作可以认为是受局部感受野概念的启发,而池化层主要是为了降低数据维度。综合起来,ü砘茨D馓卣髑郑⑶彝ü砘娜ㄖ共享及池化来降低网络参数的数量级,最后通过传统神经网络完成分类等任务。本文采用一种典型的手写数字识别网络P汀—对系统进行测试,模型结构如图示,总共包含阃缃峁梗毫礁鼍砘恪⒘礁龀鼗恪两个全连接层。网络的输人为××袼卮笮⊥计输入图像依次经过、、、愫螅玫鎏卣髦担缓笤趕分类层中将个特征值概率归一化得出最大概率值即为分类结果。网络中的具体参数设置如表尽由表梢约扑愠觯肅网络总共的权重参数量为霰淞俊H艚个变量都采用创娲ⅲù笤枷的存储资源,本文采用的—有足够的存储空间用于存放这些变

基于HLS工具的CNN加速器的设计与优化方法研究 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息