国内图书分类号:TP368
国际图书分类号:
学校代码:10213
密级:公开
工学硕士学位论文
EDGE 体系结构指令动态映射算法研究
硕士研究生:高军
导
师:喻明艳教授
申请学位:工学硕士
学
科:微电子学与固体电子学
所在单位:航天学院
答辩日期: 2012 年 7 月
授予学位单位:哈尔滨工业大学
Domestic Classified Index: TP368
U. D. C.:
Dissertation for the Master Degree in Engineering
RESEARCH ON INSTRUCTION DYNAMIC
MAPPING ALGORITHM OF EDGE
ARCHITECTURE
Candidate:
Supervisor:
Academic Degree Applied for:
Specialty:
Affiliation:
Date of Defense:
Gao Jun
Prof. Yu Mingyan
Master of Engineering
Microelectronics and Solid-State
Electronics
School of Astronautics
July, 2012
Degree-Conferring-Institution: Harbin Institute of Technology
哈尔滨工业大学工学硕士学位论文
摘
要
乱序超标量处理器中广泛存在的集总式结构已严重限制微处理器性能的提
升。EDGE(Explicit Data Graph Execution)作为应对微处理器性能提升瓶颈的模
型之一,从结构模型中摒弃了超标量中能耗大不易扩展的集总式结构。在分布
式 EDGE 结构中,指令映射到多个分片上同时执行。分片之间操作数传递需
要延时从而导致性能下降。指令映射算法通过仔细权衡程序的并行度和分片间
通信延时来试图消除分片后带来的性能损失。
TRIPS 微处理器采用关键资源拓扑结构不对称分布和静态指令映射算法
(SPDI, Static Placement Dynamic Issue)。这会导致 ET(Execute Tile)上较大的负
载不均衡和操作数网络通信热点,从而引起 IPC 下降。
本文在 M5-EDGE 模拟器中实现与 TRIPS 类似的 EDGE 结构,以此来研
究指令动态 Deep 映射算法。在缺乏编译器调度下,采用循环映射方式的 Deep
算法在发射宽度为 1 和 2 时 IPC 分别为 SPDI 的 85%和 %。针对
RT(Register Tile)和 DT(Data-cache Tile)的拓扑位置,对 Deep 映射进行三种优
化:依照 ET 编号顺序、“之”字形顺序和计算甚块全局通信跳步数之和来优
先选择 ET。在发射宽度为 1 时三种优化与基本的 Deep 算法相比平均跳步分
别减少 %、%和 %,而 IPC 分别提升 %、%和 %。这
说明在 Deep 映射下优化指令间通信跳步数能显著提高 IPC。
在 Deep 映射算法中,90%以上的操作数通过操作数旁路来传递,大大减
少操作数网络的负载。在 bypass 宽度为 2 倍发射宽度时,本地的操作数传递
延时几乎下降为 0。增加本地 bypass 宽度,能有效的减少操作数传递的延时。
将 RT 按编号分配到 ET 上,基本 Deep 映射算法的 IPC 提升 %。针对
DT 位置进行优化,优先选择靠近 DT 的 ET 和计算甚块通信跳数之和选择
ET。这两种优化比基本 Deep 映射 IPC 分别提升 %和 %。将 RT 和 DT
平铺到 ET 中形成 4x4 的拓扑结构。在发射宽度为 1 和 2 时该结构中 Deep 映
射的 IPC 分别为 SPDI 的 %和 %。计算跳步数选择 ET,这一比值
为 %和 %。微结构变化导致拓扑距离变小或者 Deep 映射算法优化
通信跳步数时,能显著提高系统 IPC。
关键词:
EDGE 体系结构;指令动态映射;性能分析
I
哈尔滨工业大学工学硕士学位论文
Abstract
Monolithic monly used in out-of-order superscalar processors
has severly limited performance improvement of
EDGE体系结构指令动态映射算法与研究 来自淘豆网m.daumloan.com转载请标明出处.