英伟达 Grace 服务器 CPU 实测不弱于 AMD 和英特尔产品,半数以上跑分优于 Bergamo、Genoa 和 Emerald Rapids
2 月 10 日消息,根据 Phoronix 对 GH100(包含单个 Grace 芯片)的评测,英伟达 Grace 服务器 CPU(72 核 Arm 架构)相比 AMD 和英特尔的产品似乎显得非常具有竞争力,在很多测试项目中都胜过了最顶级的 EPYC 9754 或 Xeon Platinum 8592+ 处理器(但整体性能依然落后于 X86 产品)。
值得一提的是,英伟达不单独销售 Grace 芯片,所以最基础的 GH100 和 GH200(包括一个 Hopper GPU 和一个 72 核的 Grace CPU,配备 480GB LPDDR5X 内存)就是唯一可以测试 Grace CPU 性能的产品。
Phoronix 借助 GPTshop.ai 远程对 GH100 进行了测试(基于 Ubuntu 23.10 进行),并与其他 CPU 进行了比较,汇总结果如下:
Benchmarks | GH200 | EPYC 9754 | Xeon 8592+ |
High Performance Conjugate Gradient | 41.69 | 25.89 | 35.42 |
Algebraic Multi-Grid Benchmark 1.2 | 1,997,929,111 | 2,291,049,667 | 1,839,912,667 |
LULESH 2.0.3 | 23,185.18 | 22,356.75 | 39,468.91 |
Xmrig 6.18.1 | 17,253 | 29,356.1 | 40,381.2 |
John The Ripper 2023.03.14 | 68,817 | 204,828 | 178,108 |
ACES DGEMM 1.0 | 17.94 | 43.68 | 29.14 |
GraphicsMagick 1.3.38 Sharpen | 1,363 | 924 | 749 |
GraphicsMagick 1.3.38 Enhance | 1,761 | 1,451 | 1,192 |
Graph500 3.0 Median | 1,239,790,000 | 1,147,090,000 | 1,238,670,000 |
Graph500 3.0 Max | 1,315,650,000 | 1,184,510,000 | 1,304,200,000 |
Stress-NG 0.16.04 Matrix | 512,759.08 | 552,067.04 | 301,894.53 |
Stress-NG 0.16.04 Matrix 3D | 17,483.02 | 8,009.21 | 13,854.38 |
下面是 GH200 CPU 基准测试结果(越低越好):
Benchmarks | GH200 | 9754 | 8592+ |
Rodinia 3.1 (Lower is better) | 30.31 | 25.15 | 39.89 |
NWChem 7.0.2 (Lower is better) | 1,403.5 | 1,700.8 | 1,850.8 |
Xompact3d Incompact3d (Lower is better) | 254.49 | 493.5 | 323.53 |
Xompact3d Incompact3d (Lower is better) | 9.81 | 9.03 | 10.18 |
Godot Compilation 4.0 (Lower is better) | 139.1 | 118.25 | 111.96 |
Primesieve 8.0 (Lower is better) | 35.49 | 21.76 | 49.06 |
Helsing 1.0-beta (Lower is better) | 67.61 | 48.95 | 84.95 |
DuckDB 0.9.1 IMDB (Lower is better) | 92.08 | 147.6 | 96.87 |
DuckDB 0.9.1 TPC-H Parquet (Lower is better) | 148.76 | 177.13 | 134.73 |
RawTherapee (Lower is better) | 46.72 | 66.13 | 45.53 |
Timed Gem 5 Compilation 23.0.1 (Lower is better) | 180.62 | 208.58 | 174.18 |
Overall Average Performance | 2,175.03 | 2,459.11 | 2,242.9 |
结果显示,这颗 Grace 芯片与英特尔 Emerald Rapids 相比有 15 项结果更优秀,而与 AMD Bergamo 和 Genoa 相比则取得了 13 场胜利。
平均而言,Grace 性能依然要比 Emerald Rapids 系列的 Xeon Platinum 8592+ 落后 3%,比 Bergamo 的 EPYC 9754 和 Genoa 的 EPYC 9654 落后 13%。
据 Phoronix 称,目前仍然有一些工作负载对于 AArch64(Arm)优化不到位,这也是 Grace 在部分场景中出现大幅劣势的一个关键原因。