传统并行计算机的体系结构
1、并行向量处理机 (Parallel Vector Processors PVP)
1976年,出现了具有实用价值的向量处理机Cray-1
单处理机,多向量寄存器模式
运算速度:3—160M flops
平均速度:20—80M flops
向量点积速度: 22M flops
利用大量的向量寄存器快速地实现向量运算。
1985年,Cray Inc.推出Cray-2 超级计算机,该机的向量处理速度是Cray-1的12倍 (1G flops)
PVP结构模型
VP: Vector Processor并行处理机
SM: Shared Memory共享内存
典型的PVP机型
80年代中、后期是PVP的时代,有很多PVP相继问世,如:
Convex公司的C3800系列
DEC公司的 VAX 9000
IBM公司的IBM 390/VF
Fujitsu公司的VP 2000
Cray公司的 YMP-90
2、对称处理机 (Symmetric Multiprocessor SMP)
将各处理器经由高速总线(或交叉开关)与共享存储器相连
每个处理器对共享存储器具有同等的访问权利
每个处理器对I/O设备和其它系统资源享有同等的访问权利
在SMP系统中一般要求每个处理机是相同的
因此称之为对称多处理机
对称多处理机结构模型
P/C: Processor/Cache处理器/缓存
典型SMP机型
SGI公司的SGI Onyx系统和SGI Power Challenge;
Sequent Computer System, Inc.的Sequent Symmetry S-81系统;
IBM公司的ES/9000系统和R50;
Sun公司的SparcCenter 2000;
我国的曙光1号。
3、大规模并行处理机 (Massively Parallel Processors MPP)
采用松耦合体系结构连接各种不同的处理器,
即各处理器以使用自己的局部内存为主,处理器之间进行同步通信实现数据交换。
大规模并行处理机结构模型
LM: Local Memory局部存储器
MPP的优缺点
MPP的优点:
(1) 突破了只看到一个统一的存储空间的方式
(2)具有良好的可扩展性
MPP的缺点:
(1)分布存储要求用户必须将被操作的数据分配到各局部存储器中
(2)运算过程中用户要考虑数据在各节点间的传送和同步
典型的MPP机型
Intel公司的Paragon XP/S ;
MasPar公司的MP-2 ;
Thinking Machine公司的CM-5;
IBM公司的SP 2 ;
Cray公司的Cray T3D;
我国的曙光 1000。
4、分布式共享存储多处理机系统 (Distributed Shared Memory DSM)
DSM系统具有以下特点:
(1)存储器在物理上分布于各处理器附近,但在逻辑上可由多个处理器共享整个内存
(2)DSM系统实际上是SMP和MPP结构的折中
分布式共享存储多处理机系统
DCM的优点与问题
DSM的优点:
(1)避免了集中式存储结构中处理器和存储器的复杂连接
(2)有良好的可扩展性
(3)相对MPP来说,更容易编程
DSM系统需着重考虑的问题:
(1)系统应具有维持存储器访问一致性的硬件支持
(2)相对SMP系统来说,其访问非物理局部存储器的时间要更长
典型DCM机型
Cray公司的Cray T3E ;
SGI/Cray公司的Origon 2000 ;
BBN公司的TC 2000。
5、工作站机群 (Cluster Of Workstations COW 或 Networked Of Workstations NOW 或 Cluster)
COW的结构特点:
(1)每一个节点机都是一个完整的工作站
(2)各节点机通过成本较低的商业网络连接起来
(3)各节点内都有本地磁盘
(4)一个完整的操作系统驻留在每个节点中
工作站机群结构模型
COW的优点与问题
COW结构的优点:
(1)系统开发周期短,用户投资风险小
(2)系统价格低,节约系统资源
(3)系统的扩展性好,用户编程方便
COW系统应考虑的主要问题:
(1)如何减少节点机间的通信开销
(2)如何改善并行程序设计环境
(3)如何充分利用全局资源