Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем
Around the conditional 4th generation of modern server processors AMD and Intel: their microarchitecture and the performance of the corresponding computing systems
[Вокруг условного 4-го поколения современных серверных процессоров AMD и Intel: их микроархитектура и производительность соответствующих вычислительных систем]
M. B. Kuzminsky Zelinsky Institute of Organic Chemistry of RAS, Moscow, Russia
Аннотация:
Обзор посвящен особенностям микроархитектуры и производительности процессоров Intel Xeon — масштабируемых процессоров 4-го поколения (c микроархитектурой Sapphire Rapids-SP, далее Xeon SPR), 5-го поколения (Emerald Rapids-SP, далее Xeon EMR), и разных классов процессоров AMD EPYC архитектуры Zen 4, а также вычислительным системам на их основе. Анализируются данные о моделях Xeon SPR (и Xeon SPR с памятью HBM, то есть Xeon Max), Xeon EMR и процессорax AMD EPYC 9004 (хотя приведены и краткие данные о EPYC 8004 и 4004).
Эти процессоры отнесены в обзоре к условному 4-му поколению Xeon и EPYC. Сопоставления проводятся и с масштабируемыми процессорами Xeon 3-го поколения — Ice Lake-SP (далее Xeon ICL), Cooper Lake-SP, с AMD EPYC с архитектурой Zen 3 (Milan), а также иногда с процессорами ARM-архитектуры и GPU.
Кратко обсуждаются средства разработки программ (SDK) для процессоров 4-го поколения, имеющие важное значение для достигаемой производительности. В связи с применением чиплетов или использованием HBM-памяти в рассматриваемых процессорах AMD и Intel особое внимание обращается на поддерживаемые варианты NUMA.
Анализируется также аппаратная поддержка средств обеспечения безопасности для задач виртуализации, которые теперь часто применяются и в области высокопроизводительных вычислений (HPC).
Данные о производительности в обзоре охватывают широкий спектр областей применения, характерных для серверов с этими процессорами. Но основное внимание уделяется HPC и, в меньшей степени, задачам ИИ.
Рассматриваемые процессоры анализируются с точки зрения построения с ними гомогенных или содержащих GPU гетерогенных серверов и вычислительных систем на их основе (кластеров и суперкомпьютеров).
Анализируется также начальная информация о новейших процессорах Intel Xeon 6 Granite Rapids и AMD EPYC Zen 5 Turin, включая первые данные об их производительности.
Сделаны выводы общего характера о состоянии и образовавшихся тенденциях развития таких процессоров x86.
Ключевые слова и фразы:
x86, Zen 4, Genoa, Bergamo, Zen 5,Turin, Sapphire Rapids, Xeon Max, Emerald Rapids, Xeon 6, Granite Rapids, микроархитектура, производительность, HPC, ИИ, суперкомпьютеры.
УДК:
004.051+004.272+004.318+004.382+004.8+004.9
ББК:
32.971.32-04
MSC: Primary
65Y05; Secondary
68M20 Поступила в редакцию: 31.05.2025
Подписана в печать : 10.11.2025
Язык публикации: русский и английский
DOI:
10.25209/2079-3316-2025-16-5-43-514