Из Неаполя в Рим: новые CPU AMD EPYC
Владимир Туров
Тестировщик

Седьмого августа был объявлен мировой старт продаж второго поколения линейки AMD EPYC™. Новые процессоры базируются на микроархитектуре Zen 2 и построены по 7-нм технологическому процессу.

Особенности

Процессор AMD EPYC 7452

«Встречают по одежке, провожают по уму», — гласит народная мудрость. Вот и мы начнем с «одежки» нового поколения. Маркировка процессоров претерпела незначительные изменения: четвертая цифра, обозначающая поколение, сменилась с 1 на 2. Первая цифра, как и ранее, обозначает серию, а вторая и третья — модель. AMD не отказались от процессоров с индексом P, которые не поддерживают работу в многосокетных системах.

Второе поколение унаследовало сокет SP3 от первого поколения без изменений, что позволяет использовать новые процессоры без обновления материнской платы, но это не сможет полностью раскрыть их потенциал. Достижение полной производительности возможно с использованием новых материнских плат, поддерживающих частоты 3200 МГц для памяти DDR4.

«Начинка» процессора преобразилась до неузнаваемости: изменился технологический процесс, была применена новая микроархитектура Zen 2 и появился новый высокоскоростной контроллер оперативной памяти.

Производительность

Переход на 7-нм технологический процесс привел к уплотнению кристалла и увеличению количества ядер до 64, что вдвое выше по сравнению с первым поколением. Базовая частота процессоров второго поколения находится в диапазоне от 2.00 до 2.90 ГГц. Для сравнения, базовая первого поколения не превышала 2.30 ГГц. Увеличение количества ядер и базовой частоты процессора стали причиной повышения тепловыделения до 120 Ватт в бюджетных версиях и до 225 Ватт в топовых.

Улучшение технологического процесса не единственное нововведение. Новая микроархитектура под названием Zen 2 внесла свою «лепту» в улучшение технических характеристик процессора. Улучшения нацелены на взаимодействие с кэшами: вдвое увеличилась скорость обмена данными с L1, увеличена скорость передачи данных между кэшами, увеличен размер L3-кэша.

Подробные технические характеристики линейки представлены в таблице.

МодельTDP, ВаттКол-во ядерБазовая частота, ГГцМаксимальная частота, ГГцРазмер L3 кэша, МБ
7742225642.253.40256
7702 / 7702P200642.003.35256
7642225482.303.30256
7552200482.203.30192
7542225322.903.40128
7502 / 7502P180322.503.35128
7452155322.353.35128
7402 / 7402P180242.803.35128
7352155242.303.20128
7302 / 7302P155163.003.30128
7282120162.803.2064
7272120122.903.2064
726215583.203.40128
725212083.103.2064
7232P12083.103.2032

Rome может похвастаться улучшением работы с внешними устройствами: впервые появилась возможность работать с контроллером внешних прерываний x2APIC, а также заявлена поддержка DDR4-3200 и 128-ми линий PCIe. В новом поколении процессоров появилась поддержка технологии Virtualized IOMMU, с помощью которой виртуальные машины получают прямой доступ к физическим периферийным устройствам.

Наращивание мощностей и улучшение условий для виртуализации приводит к увеличению количества одновременно запущенных приложений. Приложения работают с конфиденциальными данными, которые нуждаются в повышенной защите.

Безопасность

В обновленной линейке процессоров не последнее место уделили вопросам безопасности. Внутри системы на кристалле установлен процессор под названием AMD Secure Processor на базе ARM® Cortex® A5, который хранит ключи и шифрует содержимое оперативной памяти по алгоритму AES-128.

AMD Secure Processor предлагает два вида шифрования памяти (для работы данных методов требуется поддержка со стороны ОС):

  • SME (Secure Memory Encryption);

    SME шифрует память одним ключом и защищает от физических атак, таких как Cold boot attack. Использование данного типа шифрования не требует изменения пользовательских приложений: ОС отмечает страницы памяти, которые необходимо зашифровать.

  • SEV (Secure Encrypted Virtualization).

    SEV разработан для обеспечения безопасности при работе с виртуальными машинами (ВМ). Память, используемая гипервизором и каждой из ВМ, шифруется собственным ключом. Такой подход криптографически изолирует гипервизор и ВМ друг от друга.

Тестовые серверы

Теперь, когда известна теория о новинке, проведем практические испытания. Представителем второго поколения выступит AMD EPYC™ 7452. Оппонентом из первого поколения выбран AMD EPYC™ 7551. Противник из «синего» лагеря — Intel® Xeon® Gold 5218 в составе двухсокетной системы. Выбор этих систем обоснован схожестью их технических характеристик.

EPYC 7452EPYC 7551Xeon 5218
Количество ядер323216
Количество потоков646432
Базовая частота, ГГц2.352.002.30
Максимальная частота, ГГц3.703.003.90
Расчётная мощность, Ватт155180125
Тип оперативной памятиDDR4-3200DDR4-2666DDR4-2666
Кэш L1, KБ204830721024
Кэш L2, КБ163841638416384
Кэш L3, МБ1286422

В тестах процессоры ставятся в равные условия: одинаковая память, одинаковые диски и идентичные операционные системы с идентичными настройками.

Для достижения максимальной производительности все каналы контроллера памяти процессора должны быть задействованы. Процессоры Intel® располагают шестью каналами, а процессоры AMD — восьмью. При таком различии сложно создать идентичные условия, поэтому был найден компромисс: в системы с процессорами AMD установлены 8 модулей по 16 ГБ каждая, а в двухсокетную систему с Intel® Xeon® установлены 12 модулей по 8 ГБ. Все модули оперативной памяти работают на частоте 2666 МГц.

Операционная система (ОС) размещается на SSD-дисках, чтобы уменьшить влияние дисковой подсистемы на испытания. Все тесты были проведены на CentOS версии 7.

EPYC 7452EPYC 7551Xeon 5218
Процессоры1 x AMD EPYC 74521 x AMD EPYC 75512 x Intel Xeon 5218
Оперативная память8 x 16GB DDR4-26668 x 16GB DDR4-266612 x 8 GB DDR4-2666
Диски1 x Samsung SSD 850 EVO 250GB1 x Intel SSD S4510 480 GB1 x Intel SSD S4510 480 GB

Тесты

Тестирование должно быть максимально объективным, тем более что речь идет о сравнении процессоров Intel® и AMD. Поэтому мы не будем использовать оптимизирующих компиляторов для сборки тестов, которые поставляются в виде исходных кодов.

GeekBench 4

GeekBench — популярный кроссплатформенный тест производительности процессора с собственной онлайн-базой результатов. Тест поставляется в виде готовых исполняемых файлов, из-за чего оптимизация под конкретные процессоры не предусмотрена.

Для нас важны общие метрики групп GeekBench:

  • Crypto Score;
  • Integer Score;
  • Floating Point Score;
  • Memory Score.

Указанные группы тестов запускаются в двух режимах: в один поток и при одновременном выполнении на всех ядрах. На основе полученных результатов GeekBench ставит итоговые оценки: Single-Core Score и Multi-Core Score.

Результаты тестирования в режиме Single-Core

Основная борьба разворачивается между AMD EPYC™ 7452 и Intel® Xeon® Gold 5218, в то время как первое поколение EPYC™ во всех тестах уступает второму.

Рассмотрим однопоточные тесты. Rome показывает превосходный результат при работе с криптографическими задачами и памятью, но проигрывает при выполнении целочисленных вычислений. Как результат — второе поколение EPYC™ набирает 4893 балла и становится победителем в номинации Single-Core. Второе и третье место занимают Xeon и EPYC первого поколения с 4695 и 3981 баллами соответственно.

Результаты тестирования в режиме Multi-Core

В многопоточных тестах расклад сил значительно меняется. EPYC™ 7452 отлично справляется с вычислениями, но сдает позиции в криптографических задачах и работе с памятью, что не мешает ему стать лидером с 96009 баллами в номинации Multi-Core.

SPEC CPU 2017

SPEC CPU 2017 — признанный производителями процессоров набор тестов производительности. Тесты данного набора распространяются в виде исходных кодов, что позволяет оптимизировать их под конкретное оборудование на конкретной операционной системе.

SPEC CPU состоит из четырех наборов тестов:

  • int_rate;
  • int_speed;
  • fp_rate;
  • fp_speed.

Первая часть в имени теста определяет вид вычислений на процессоре: целочисленные (int) или над числами с плавающей точкой (fp). Вторая часть определяет вид тестирования: одноядерное (rate) или многоядерное (speed).

Мы провели все четыре набора тестов. Тесты собраны на третьем уровне оптимизаций с помощью набора компиляторов GNU версии 4.8.5. Многоядерные тесты запускались в 64 потока, а одноядерные тесты запускались в 32 копии.

Результаты тестирования набором тестов SPEC 2017

Тесты, собранные с оптимизациями, показывают противоречивые с GeekBench результаты. Второе поколение AMD EPYC™ превосходит двухсокетную систему с процессорами Intel® во всех тестах, кроме intspeed, но с значительно меньшим отрывом, чем в GeekBench.

Phoronix Test Suite

Phoronix Test Suite (PTS) — программное обеспечение, позволяющее запускать тесты из большой базы пользовательских тестов производительности. Данное решение позволяет автоматизировано запускать желаемые тесты на нескольких подопытных серверах одновременно с агрегацией результатов на мастер-сервере.

Мы разработали собственный набор из 21 теста, среди которых:

  • тестирование пропускной способности кэшей (CacheBench);
  • тестирование пропускной способности оперативной памяти (RAMspeed, Stream, MBW);
  • решение криптографических задач (Botan, OpenSSL, John the Ripper);
  • рендеринг изображений методом трассировки лучей (C-Ray, POV-Ray, Smallpt);
  • эмуляция работы сервера NGINX под нагрузкой;
  • конвертирование аудио/видео.
EPYC 7452EPYC 75512 x Xeon 5218
RAMspeed SMP — Type: Add — Benchmark: Integer32476,926531,4928942,2
RAMspeed SMP — Type: Copy — Benchmark: Integer30325,7623419,8627165,75
RAMspeed SMP — Type: Scale — Benchmark: Integer30429,7622011,0828629,12
RAMspeed SMP — Type: Triad — Benchmark: Integer31482,618208,5828299,14
RAMspeed SMP — Type: Average — Benchmark: Integer31060,831745,7128432,31
RAMspeed SMP — Type: Add — Benchmark: Floating Point32434,2637939,528445,26
RAMspeed SMP — Type: Copy — Benchmark: Floating Point30386,9935209,9727119,9
RAMspeed SMP — Type: Scale — Benchmark: Floating Point30097,1130509,0526508,4
RAMspeed SMP — Type: Triad — Benchmark: Floating Point32473,0438458,628385,89
RAMspeed SMP — Type: Average — Benchmark: Floating Point31295,534393,327637,44
Stream — Type: Copy107192,8110996,94126257,4
Stream — Type: Scale72434,4287300,88105633,7
Stream — Type: Triad77729,7297735,96115100,86
Stream — Type: Add77021,1697204,36114907,6
MBW — Test: Memory Copy — Array Size: 8192 MiB16888,5212402,324845,29
MBW — Test: Memory Copy, Fixed Block Size — Array Size: 8192 MiB10752,127410,172982,56
CacheBench — Test: Read2312,412079,623286,28
CacheBench — Test: Write24357,420329,2127520,75
CacheBench — Test: Read / Modify / Write24920,321598,9828966,95
GNU MPC — Multi-Precision Benchmark714358108950
NAMD — ATPase Simulation — 327,506 Atoms0,800790,941190,77091
Botan — Test: KASUMI — Encrypt69,6961,7478,69
Botan — Test: KASUMI — Decrypt67,1658,5774,85
Botan — Test: AES-256 — Encrypt4575,944173,763687,71
Botan — Test: AES-256 — Decrypt4552,924152,073704,3
Botan — Test: Twofish — Encrypt279,59247,38325,1
Botan — Test: Twofish — Decrypt281,87249,85333,97
Botan — Test: Blowfish — Encrypt247,76217,14282,4
Botan — Test: Blowfish — Decrypt249,19217,89283,61
Botan — Test: CAST-256 — Encrypt116,150101,470124,690
Botan — Test: CAST-256 — Decrypt116,68101,95125,75
John The Ripper — Test: Blowfish498514056839555
7-Zip Compression — Compress Speed Test163202107009135458
C-Ray — Total Time — 4K, 16 Rays Per Pixel23,4126,6529,48
POV-Ray — Trace Time18,6723,320,46
Smallpt — Global Illumination Renderer; 128 Samples15,065,5258,97
dav1d — Video Input: Summer Nature 4K17,6728,3720,98
FLAC Audio Encoding — WAV To FLAC12,2214,1711,43
FFmpeg — H.264 HD To NTSC DV9,1410,8511,46
Hackbench — Count: 1 — Type: Thread3,95,823,35
Hackbench — Count: 8 — Type: Thread10,918,118,73
Hackbench — Count: 1 — Type: Process3,785,433,15
Hackbench — Count: 8 — Type: Process9,6613,318,14
Hackbench — Count: 32 — Type: Process39,0232,2527,74
OpenSSL — RSA 4096-bit Performance6825,94351,476809,23
ctx_clock — Context Switch Time211220160
NGINX Benchmark — Static Web Page Serving26991,7917497,0228274,97
Schbench — Message Threads: 2 — Workers Per Message Thread: 242204101
Schbench — Message Threads: 8 — Workers Per Message Thread: 8462447047009
Schbench — Message Threads: 32 — Workers Per Message Thread: 32156416157952167509
Radiance Benchmark — Test: Serial807,01783,481102,24
Radiance Benchmark — Test: SMP Parallel260,47238,69333,32

Впервые в тестах AMD EPYC™ 7551 выходит на первое место. Процессоры AMD вне зависимости от поколения лучше справляются в однопоточной работе с памятью, рендеринге и перекодировании видео. Процессоры Intel®, в свою очередь, лучше справляются с криптографическими задачами и многопоточной работой с памятью, как и было выявлено ранее в тестах GeekBench.

Выводы

Несмотря на многообразие тестов, выбор между первым и вторым поколением AMD EPYC™ очевиден: Rome превосходит своего предшественника в подавляющем большинстве тестов. Тем не менее, первое поколение не сдает позиции в работе с памятью и рендеринге.

Сравнение процессоров Intel® и AMD — настоящая битва титанов, требующая детального рассмотрения. Устанавливаемые программные решения в среднем выполняются лучше на втором поколении AMD EPYC™. В частности, Rome показывает превосходные результаты в многопоточных вычислениях и однопоточных криптографических задачах. При работе с программным обеспечением, которое компилируется из исходных кодов, предпочтение отдается процессорам нового поколения EPYC™, которые лидируют в тестах с плавающей запятой и лишь незначительно отстают в многопоточных целочисленных вычислениях.

Intel® Xeon® Gold, в свою очередь, показывает хорошие результаты в многопоточной криптографии, перекодировании аудио и работе с памятью. Двухсокетная система с процессорами Intel® Xeon® показала хороший результат при обработке запросов веб-серверов.

Подводя итог, следует отметить, что проведенные тесты являются синтетическими и результаты на реальных задачах могут отличаться. Для получения точных результатов на конкретных задачах необходимо дополнительное тестирование. Теперь буквально пару слов о стоимости. Рекомендованная цена AMD EPYC™ 7452 составляет $2025, для Intel® Xeon® Gold 5218 — $1250, то есть $2500 для организации двухсокетной системы.

Новый AMD EPYC™ 7452 скоро появится в нашей лаборатории Selectel Lab.

Узнайте об этом первыми!

Выход второго поколения EPYC™ — лишь очередной виток в противостоянии AMD и Intel®. Подробнее о том, с чего началось соперничество двух корпораций можно прочитать в нашем блоге. А как вы думаете, сможет ли Intel® дать достойный отпор Rome в ближайшее время?

Что еще почитать по теме

Владимир Туров 1 сентября 2020

Дело совершенно секретного iPod

Это был обычный серый день в конце 2005 года. Я сидел на рабочем месте и писал код для следующей версии iPod. Вдруг без стука ворвался директор ПО для iPod, начальник моего начальника, и закрыл дверь.
Владимир Туров 1 сентября 2020

Новое в блоге

Владимир Туров 18 сентября 2021

Разбираем редкого зверя от Nvidia — DGX A100

Крупные IT-компании располагают дорогими «игрушками», которые скрыты от взоров большинства пользователей. Сегодня мы приоткроем завесу тайны и расскажем про систему, которая оптимизирована для работы …
Владимир Туров 18 сентября 2021
Андрей Зайцев 8 сентября 2021

Продуктовый дайджест: новые серверы, Selectel Connect и обновления «Облачной платформы»

У нас обновления в конфигурациях серверов, кластерах Kubernetes и разделах базы знаний. А еще обратите внимание на сервис Selectel Connect. В конце дайджеста — анонс конференции по ML и записи митапов…
Андрей Зайцев 8 сентября 2021
Ульяна Малышева 12 августа 2021

RHVoice Lab: как серверы помогают создавать голоса для синтезаторов речи

В этом году Selectel стал поддерживать некоммерческий проект RHVoice Lab — лабораторию по созданию новых голосов для одноименного отечественного синтезатора речи. Его особенность в том, что синтезатор…
Ульяна Малышева 12 августа 2021
Ульяна Малышева 11 августа 2021

Продуктовый дайджест: автомасштабирование в Managed Kubernetes и две услуги в бете

Запустили две услуги в бете — «Файловое хранилище» и «Бэкапы по расписанию», реализовали автомасштабирование нод в Managed Kubernetes, а также добавили возможность арендовать виртуальные серверы с гар…
Ульяна Малышева 11 августа 2021