中国CPU与DSP专刊·论文中国科学:信息科学 2015年 第45卷 第4期: 480–500 o. 引用格式:吴瑞阳,汪文祥,王焕东, :信息科学, 2015, 45: 480–500, doi: -00292 龙芯 GS464E处理器核架构设计吴瑞阳?-?*, 汪文祥?-, 王焕东ˉ, 胡伟武?-ˉ ?计算机体系结构国家重点实验室,中国科学院计算技术研究所,北京100190 -中国科学院计算技术研究所,北京100190 ?中国科学院大学,北京100049 ˉ龙芯中科技术有限公司,北京100190 *通信作者. E-mail: ******@ict. 收稿日期: 2014–10–16;接受日期: 2015–01–08 国家科技重大专项“核高基”(批准号: 2009ZX01028-002-003, 2009ZX01029-001-003, 2010ZX01036-001-002, 2012ZX01029- 001-002-002, 2014ZX01020201, 2014ZX01030101)、国家自然科学基金(批准号: 61221062, 61133004, 61173001, 61232009, 61222204, 61432016)和国家高技术研究发展计划(863计划) (批准号: 2012AA010901, 2012AA011002, 2013AA014301)资助摘要龙芯 ,将介绍 GS464架构,重点强化了访存性能和分支预测准确率,实现了 MIPS DSP指令集和虚拟机支持,增大了处理器中各项队列的项数,并增大了 Cache容量和 3级 Cache结构,每一级都采用 LRU替换策略,, GS464E处理器核已成为一个创新性的高性能处理器核架构. 关键词处理器核多核处理器分支预测访存性能缓存一致性 1 引言多年来,龙芯高性能处理器芯片一直采用龙芯 2F [1]芯片设计的 GS464处理器核 IP(intellectual property),该 IP使用 64位数据宽度,支持 4发射和乱序发射、动态流水线技术,,龙芯 3A [2, 3]、龙芯 3B [4~6],在多年的使用中, GS464架构的一些性能问题逐渐显现出来,,针对上一款处理器核架构的缺陷,调研了 IBM公司的 Power7 [7]、 Intel公司的 Ivy Bridge [8]以及 ARM公司的 Cortex-A9 1)等多款世界尖端芯片的设计规格,龙芯公司于 2012 年开始研发 GS464E处理器核 , 3A1500四核处理器已于 2014年流片. GS464E处理器核架构的主要特点有: ?,优化了分支预测准确率,采用了双访存部件的设计,使用近期最少使用(least recently used, LRU)替换算法的一级数据 Cache,设计了一套激进的预取策略,降低定点指令相关带来的延迟,并采用更大的发射队列、重定序队列及更大的牺牲 Cache (Victim Cache).上述设计大幅提高了单线程程序的性能. 1) A9 processor. ducts/processors/cortex-a/cortex-. 中国科学:信息科学第45卷第4期?片上共享 Cache (shared cache, SCache)在维持于每个 SCache体 1 MB容量不变的情况下,设计为 16路组相联,使用 LRU替换策略,并采用标识部分(tag)和数据部分(data) SCache设计提高了多核多任务下的片上末级 Cache性能. ?定义了 LoongISA指令集结构, MIPS DSP指令集 2),实现了虚拟机支持,并设计有 X86及 16 KB每路的一级 Cache的情况下支持 4 KB的页大小,还加入了硬件抗别名(anti-alias)支持. ?在处理器核与片上末级 Cache之间、以及片上末级 Cache和内存系统之间,都采用 AXI接口, 与之前的 GS464处理器系列兼
龙芯e架构设计精要 来自淘豆网m.daumloan.com转载请标明出处.