什么是计算机体系结构中的凸模?

Convex 是第一个将 CC-NUMA 机器(称为 SPP1000)商业化的设备产品。SPP 代表可扩展并行处理器。SPP Exemplar 系列的目标是制造一个高实现计算机系列,其中多个处理器的范围可以简单地从 10 到 1000,并且峰值实现将达到 TeraFLOPS。

SP1000 的节点是对称多处理器,称为超级节点。每个超级节点包括四个功能块和一个 I/O 子系统。每个功能块包括两个 CPU (HP PA-RISC),发送一个单独的 CPU 代理,以及一个影响超节点私有内存数据、全局内存数据和网络缓存数据的内存单元。五端口交叉开关将四个功能块和 I/O 子系统互连。

超级节点由四个 SCI(可扩展相干接口)点对点单向环连接。SCI 可以支持多种互连网络,单向环是那些对全局存储器的顺序存储器引用跨越四个环交错的一种。

这是通过在与目标存储器相同的功能单元中使用环来实现的,因为存储器以 64 字节为基础进行交错。四个SCI环也是在此基础上交错排列的,64字节为网络缓存线大小。

SPP1000 的全局共享内存分布在超级节点之间。Convex Exemplar 系列是使用分层内存架构构建的,其中包含四种类型的可分配内存,根据数据的分配和共享方式不同。

在分配、共享或延迟上存在四种不同的内存并不意味着必须有四种不同的物理内存。所有四个内存,以及网络缓存,可以由每个超节点上的相同物理内存实现。

在示例中提供了以下类型的内存,按增加内存延迟的顺序列出 -

  • CPU 专用内存用于仅由单个 CPU 访问的数据。CPU 专用内存不是物理执行的。它是划分超代码-私有内存用作每个CPU的CPU-私有内存的操作框架。

  • 为仅由单个超节点内的 CPU 共享的数据提供超节点私有内存。

  • 近共享内存可从所有超级节点普遍访问。这个内存是从全局内存中分配的,从本地超级节点访问一个接近共享的内存比从其他节点访问它需要更少的延迟。

  • 远程共享内存可从所有超级节点以相同的延迟普遍访问。它是从几个超级节点的全局内存中分配的。设计为远共享(由多个超级节点共享并分布于多个超级节点)的相干内存通过表条目的操作系统软件分配以每页(4 KB)为单位在超级节点之间交错。