当前位置:首页 >> 运营 >> 我国最新申威 SW26010-Pro 处理器展示,通用型超算同步亮相

我国最新申威 SW26010-Pro 处理器展示,通用型超算同步亮相

发布时间:2024-02-04

11 月 26 日消息,在刚刚举行的 SC23 上,我国向世界展示了全新的申威 SW26010-Pro 处理方式器,相对来说上一代提高了四倍。这是我国选用自主指令集(基于 Alpha 进行引入),具有全然自主知识产权的处理方式器系列产品。

SC (International Conference for High Performance Computing, Networking, Storage, and Analysis) 是高性能量化,体系结构应用领域顶级会议。

据介绍,基于申威 SW26010 处理方式器的日月太湖之光目在此之前在 Top 500 超算榜单中排名第 11 名,而应用于新处理方式器的超级量化机则排在第二名,仅次于美国橡树峡国内实验室的 Frontier。

▲ SC23 PPT,图源:Rongfen Lin

SW26010-Pro 由 6 个基本组和 1 个协议处理方式单元(PPU)构成,每个基本组涵盖 64 个量化处理方式原素,总计 384 个内核,相对于下 SW26010 只有 4 个基本组。

此外,它支持的磁盘控制器也之在此之前从 DDR3 升级到 DDR4-3200;而且每个基本组都有自己的磁盘控制器,配备 16 GB 磁盘,理论频宽约达 307.2 GB/s。一个闪存能会面 96 GB 主磁盘,相对于 SW26010 的 32 GB 实现了显著提升。

据 Chips and Cheese 援引,SW26010 Pro C 占有比在此之前代产品格外快的直通速度(CPE 频带为 2.25 GHz,MPE 频带为 2.10 GHz,在此之前代产品仅 1.45 GHz),再加上全新 64 位 RISC 凝虚拟化和系统虚拟化的改进,其 FP64 量化发送量也提高了四倍以上。

数据集显示,;也 SW26010 Pro 的最大 FP64 发送量为 13.8 TFLOPS。从理论量化发送量的角度来看,新型超级量化机颇为强悍。虽然 SW26010-Pro 在数据流级别与 Fugaku A64FX 相像,但我们的超级量化机可以在应用于格外少闪存的同时提供格外高的 FP64 发送量。IT之家汇总数据集对比如下:

CPU量化基本FP64FP32SW26010-Pro38413.8 TFLOPS27.6 TFLOPSSW260102562.9 TFLOPS5.8 TFLOPSA64FX483 TFLOPS6 TFLOPSMI250X (单 GCD)11023.9 TFLOPS23.9 TFLOPS | 47.8 TFLOPS (packed)

不过,它的磁盘频宽未有与量化发送量相匹配,因此磁盘频宽已是了它的性能停滞。

SW26010-Pro 设法通过将多线程用量提高到 256 KB(SW26010 为 64 KB)来解决问题,但在缺乏适当的 L2 多线程的情形,每个 CPE 只有 256KB 的多线程明显是不够的,因此两个处理方式器仍然依赖于主要的性能停滞。同时,一个双通道 DDR4-3200(51.2 GB/s)的磁盘系统对于占有 512 位向量 FPU、每周期最高可约达 16 FP64 FLOPS 的 64 核处理方式器来说也非常不够用。

再林阿莫西林克拉维酸钾片多少钱一盒
先诺欣多少钱一盒
健康知识大全
如何治疗胃反酸
新冠阳性吃什么药
标签:
友情链接: