下载此文档

第5章 向量流水与向量处理机.ppt


文档分类:IT计算机 | 页数:约49页 举报非法文档有奖
1/49
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/49 下载此文档
文档列表 文档介绍
第5章向量流水与向量处理机
内容提要:
本章首先简要介绍向量流水的基本概念与工作原理,然后讲述向量流水处理机的组成原理、向量操作长度控制与向量访问步长、向量处理方法、向量处理机多功能部件的并行操作以及向量处理性能的评估参数与评估方法。重点是向量流水机的组成原理、向量操作长度控制与向量访问步长、向量处理方法和向量处理机多功能部件的并行操作。难点是向量操作长度控制、向量处理方法、向量处理机多功能部件的并行操作过程。
第5章向量流水与向量处理机
向量流水的概念与工作原理
向量处理与增强向量处理性能的方法
向量处理性能的评价参数与评价方法
向量化编译技术
向量处理机举例
向量流水的概念与工作原理
向量流水的概念与特点
向量处理机的基本组成
向量启动时间与结果流出时间
向量操作长度控制与向量访问步长
向量流水的概念与特点

向量中各元素之间有固定的位置或者联系,在运算时各元素相互独立或关系很少。向量运算时各元素一般进行相同的操作。这样,只要能从存储器中不断地取出这些元素,就能进行流水处理,发挥流水线的效能。
这样,把向量数据表示与流水线技术结合起来,就构成向量流水处理机,简称为向量流水机或向量处理机(Vector Processor)。

①一条向量指令相当于一个标量循环。这样,可降低对指令访问速度(带宽)的要求,还可消除标量机中由于循环而引起的控制(资源)相关。
②每一个结果元素仅与参加运算的元素有关,与上一次运算的值无关,因此向量流水线可以有较大的深度。
③若要访问的向量元素相邻,可存储到多体交叉存储器中,以提高访存速度。
④在一般向量流水机中,允许访问存储器与有效地址的计算流水化,在高档向量流水机中还允许多个向量操作同时进行,即多向量并行操作。
向量处理机的基本组成

向量元素及其处理的结果元素可存放在存储器中,也可存放在寄存器堆中,故可分为两种类型:存储器—-存储器型和寄存器—-寄存器型。
早期的向量处理机多属于存储器—-存储器型,比如TI公司的ASC机,CDC公司的STAR—100以及CYBER-205和ETA-10等。

1976年美国CRAY公司推出寄存器—-寄存器结构的向量机,易操作,速度快,指令系统简洁,因而很快成为向量处理机的主流机型。比如CRAY公司的Y-MP和C-90,日本Fujitsu公司的VP2000、VPP300/500,以及我国的YH等。
,由一个标量流水部件和一个向量流水部件组成。其中标量流水部件是为实现向量中的标量运算而设置的,包括标量功能部件和若干个标量寄存器。向量流水部件主要用于向量运算,包括向量功能部件、向量存取部件、向量寄存器以及向量控制器等。
向量处理机基本系统结构

【】设有长度同为64的两个向量X和Y,其地址分别由寄存器Rx和Ry表示,通过分析Y=a×X+Y,来说明向量运算过程,其中a 为标量。
解:根据题意a为标量,每一个向量元素占8个字节单元,在标量计算机中通过循环程序实现向量运算,程序如下:
LD F0,a, ;标量a送入寄存器F0
ADDI R4,Rx,#512 ;向量元素的末地址送入R4
LOOP:LD F2,0(Rx) ;取向量元素X(i)
MULD F2,F0,F2 ;F2←a×X(i)
LD F4,0(Ry) ;取向量元素Y(i)
ADDD F4,F2,F4 ;F4←a×X(i)+ Y(i)
SD 0(Ry),F4 ;存结果元素
ADDI Rx,Rx,#8 ;修改向量X元素的下标
ADDI Ry,Ry,#8 ;修改向量Y元素的下标
SUB R10,R4,Rx ;R10←(R4)-(Rx)
BNZ R10,LOOP ;若没有结束转移到LOOP
在向量机上使用向量机指令编程如下,其中Rx和Ry表示向量寄存器:
LD F0,a ;标量a送入寄存器F0
LV V1,Rx ;取向量X
MULTV V2,F0,V1 ;V2←a×X
LV V3,Ry ;取向量Y
ADDV V4,V2,V3 ;V4←a×X+ Y
SV Ry,V4 ;存结果
通过对上述程序进行分析可以看出,在标量机上进行运算共执行9×64+2=578条指令,其中还包含大量的延迟等待。而在向量机上进行运算,仅需要6条向量指令。

第5章 向量流水与向量处理机 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数49
  • 收藏数0 收藏
  • 顶次数0
  • 上传人中国课件站
  • 文件大小0 KB
  • 时间2011-10-11