Итоги мая: тесты B300, новые GPU Alibaba и PCIe 8.0

Железный дайджест мая: тесты B300, GPU от Alibaba и PCIe 8.0

Сергей Ковалёв
Сергей Ковалёв Продакт-менеджер
15 июня 2026

Разбираем новинки мая, делимся техническими характеристиками от вендоров и оцениваем перспективы.

Изображение записи

На связи Сергей Ковалёв с традиционным ежемесячным дайджестом железа. Сегодня я пробую новый формат: по ходу месяца мы с коллегами публикуем новости железных новинок, и я собрал их с краткими аннотациями в первой части статьи. Если вы уже читали наши новости, смело переходите ко второй части — в ней собрал то, до чего не дошли наши писательские руки.

О чем писал Selectel в мае

AMD Instinct MI430X

AMD анонсировала MI430X — HPC-ускоритель с 432 ГБ HBM4, пропускной способностью 19,6 ТБ/с и нативным FP64 свыше 200 TFLOPs. Это не развитие серии MI350X, а другой класс железа для научных расчетов, где FP32 просто не подходит. Задачи для GPU: CFD (гидродинамика), молекулярная динамика, ядерные расчеты. NVIDIA предлагает эмуляцию FP64 через тензорные ядра, но для ряда реальных задач высокопроизводительных вычислений это дает лишь 33 TFLOPs против честных 200 у AMD. Подробности в статье.

AMD Instinct MI350P

AMD выпустила первую с 2022 года PCIe-карту серии Instinct™ MI350P с 144 ГБ HBM3E. Архитектура CDNA™ 4 в стандартном двухслотовом форм-факторе с TDP 600 Вт. По сути, это половина MI350X: четыре XCD-кристалла вместо восьми, пропускная способность памяти — 4 ТБ/с. Прямой соперник H200 NVL, только без NVLink®, то есть объединить карты в пул не получится. Полная заметка здесь.

NVIDIA HGX B300: тест на инференсе

Не про новое железо, но нельзя пройти мимо в майском дайджесте. Взяли HGXTM B300 с 2,3 ТБ VRAM и прогнали на нем DeepSeek R1/V3.2, Qwen 3.5 397B и Minimax M2.5 через vLLM. NVFP4 дает двух-трехкратный прирост на prefill по сравнению с FP8 — это реально ощутимо. На decode разница скромнее и пока до конца не объяснена, но Qwen 3.5 в NVFP4 вытягивает 330 тысяч ответов в сутки при decode-окне в 1000 токенов. Читайте, это интересно!

Alibaba Zhenwu M890

Alibaba представила GPU Zhenwu™ M890 с 144 ГБ HBM, межчиповым интерконнектом 800 ГБ/с и поддержкой FP4 для инференса. На его базе собрали суперсервер Panjiu® AL128 — это стойка из 128 ускорителей с задержкой между GPU менее 150 наносекунд. По памяти паритет с H200, по масштабированию кластеров — тоже, но главное здесь не характеристики, а стек и предпочтения рынков. Раскрыли тему устройства в статье.

Majestic Labs Prometheus

Стартап Majestic Labs анонсировал серверную платформу Prometheus — собственные AIU-чипы Ignite на архитектуре Arm + RISC-V с единым адресным пространством памяти до 128 ТБ на весь сервер. Это примерно в 60 раз больше, чем у восьми B300 SXM в стандартной HGX-конфигурации. Пока все это существует на уровне лендинга без публичных бенчмарков и цен. Главный вопрос: какова реальная пропускная способность этих 128 ТБ? Его компания пока обходит стороной, о других подробностях в заметке.

Dell PowerEdge R7725xd + Kioxia LC9

Dell™ и Kioxia™ объявили первый сервер с флеш-памятью объемом 9,8 ПБ в форм-факторе 2U. Это Dell™ PowerEdge™ R7725xd с 40 дисками Kioxia™ LC9 до 245,76 ТБ в формате E3.L. Диски построены на BiCS8 3D QLC NAND™, скорость последовательного чтения до 12 ГБ/с, случайное чтение 1,3 млн IOPS. Для аналогичной емкости на стандартных 30-терабайтниках понадобилось бы еще семь серверов и 280 дополнительных дисков. Статья по ссылке.

Huawei HSSD 122 ТБ

Huawei представила SSD до 122,88 ТБ, обойдя санкционные ограничения на 3D NAND с помощью собственной технологии DoB. Кристаллы размещаются прямо на плате без корпусной упаковки, что дает прирост плотности на 33%. В основе NAND от китайского YMTC (Xtacking 4, до 232 слоев), которая уступает топовой Samsung, но DoB компенсирует разрыв за счет компоновки. В СХД OceanStor Pacific 9926 с 36 дисками на 122 ТБ получается 4,42 ПБ в корпусе 2U. Читайте здесь.

Micron 6600 ION 245 ТБ

Micron объявила о поставках SSD 6600 ION емкостью 245,76 ТБ на 276-слойной G9 QLC NAND с интерфейсом PCIe Gen5. По заявлению компании, это самый объемный SSD, доступный к покупке. Скорость последовательного чтения до 13,7 ГБ/с. Цена пока не афишируется, но по найденным в продаже дискам на 122 ТБ можно прикинуть, что один терабайт на SSD 6600 ION обходится примерно в пять раз дороже HDD. Подробнее в статье.

Celestica DS6000

Celestica выпустила коммутаторы DS6000 на базе Broadcom Tomahawk 6. В них 64 порта по 1,6 Тбит/с и коммутационная способность 102,4 Тбит/с. Есть два варианта: классический 3U с воздушным охлаждением и OCP ORv3 с гибридным воздушно-жидкостным, где шесть кВт потребления говорят сами за себя. Для массовых дата-центров пока избыточно, но кластерам на тысячи GPU такой запас уже нужен, об этом можно прочитать подробно.

Что интересного еще выпустили вендоры

Dell PowerEdge XE9785 — AMD EPYC 9005 Turin + MI355X в одном корпусе

Стоечный сервер Dell PowerEdge XE9785 серебристого цвета в металлическом корпусе, ракурс сверху под углом, видны вентиляционные решетки и элементы интерфейса на передней панели.
Сервер Dell PowerEdge XE9785. Источник.

Dell™ выпустила PowerEdge™ XE9785 — двухсокетный сервер в форм-факторе 10U с воздушным охлаждением на платформе AMD®.

Характеристики:

  • CPU: два AMD EPYC™ 9005 Turin, до 384 ядер суммарно;
  • RAM: 24 слота DDR5-6400 RDIMM, до 6 ТБ суммарно;
  • Хранение: до 16 NVMe E3.S PCIe 5.0 (до 245,76 ТБ) или до десяти NVMe U.2 (до 153,6 ТБ) + два M.2 внутренних;
  • ускорители: восемь AMD Instinct™ MI355X по 288 ГБ HBM3E каждый, пропускная способность памяти 8 ТБ/с;
  • интерконнект GPU: AMD Infinity Fabric™;
  • альтернативная конфигурация: восемь NVIDIA HGX™ B300 + NVLink
  • питание: 12 блоков по 3200 Вт (80 Plus® Titanium, горячая замена);
  • охлаждение: воздушное — 15 вентиляторов в зоне GPU (все с горячей заменой), пять — в зоне CPU (все с холодной заменой);
  • сеть: слот OCP 3.0 (PCIe 5.0 x8), 2 × RJ45, Mini-DisplayPort, USB Type-A и Type-C.

10U воздушного охлаждения при таком теплопакете — смелое решение. Охладить сервер сложно, но возможно. Зато не нужна инфраструктура СЖО. Dell также объявила о поддержке AMD Instinct MI350P в серверах PowerEdge XE7745 и R7725, о таком GPU мы уже писали ранее.

AMD пытается составить конкуренцию NVIDIA в задачах обучения моделей и инференса, а ключевые вендоры реализовывают такие решения. Но не забывают и о запасном варианте, адаптируя такие серверы и под возможность использования B300.

Giga Computing TO46-SD3-LA07 — HGX B300 с жидкостным охлаждением

Передняя панель мощного стоечного сервера Giga Computing TO46-SD3-LA07. На металлическом корпусе видны отсеки для накопителей с зелеными защелками, разъемы USB и VGA, индикаторы состояния и вентиляционные решетки.
Сервер TO46-SD3-LA07. Источник.

Giga Computing (дочка Gigabyte) не отстает от Dell, и тоже показала новинку, OCP-сервер TO46-SD3-LA07 на платформе NVIDIA HGX B300. 

Характеристики:

  • CPU: два Intel® Xeon® 6 6500/6700 (Granite Rapids-SP);
  • RAM: 32 слота DDR5 RDIMM/MRDIMM;
  • хранение: восемь SFF NVMe (горячая замена) + два M.2 PCIe 5.0 x4 и PCIe 5.0 x2;
  • расширение: 4 PCIe 5.0 x16 FHHL;
  • GPU: восемь NVIDIA B300;
  • DPU: совместим с NVIDIA BlueField®-3;
  • сеть: 8 OSFP InfiniBand® XDR (до 800 Гбит/с) или 2 × 400GbE (NVIDIA ConnectX®-8 SuperNIC);
  • охлаждение: прямое жидкостное, покрывает GPU и CPU, есть датчик утечки.

Сервер традиционно предназначен под обучение моделей и инференс. Стандарт OCP позволяет эусплуатантам не привязываться к конкретному вендору шасси. Жидкостное охлаждение для HGX B300 — отличный бонус: охлаждать воздухом такие системы достаточно сложно.

На рынке уже вышло следующее поколение Rubin, но вендоры уровня Giga часто выпускают предыдущие системы с задержкой, тем более, что спрос на B300 на рынке остается актуальным.

HPE Compute Scale-up Server 3250 — до 64 ТБ RAM в одной системе

Масштабируемый сервер HPE Compute Scale-up Server 3250 с установленной декоративной защитной панелью (bezel), вид в три четверти
HPE Compute Scale-up Server 3250. Источник.

HPE анонсировала Scale-up Server 3250 — модульный сервер под задачи, где оперативная память важнее всего остального. Например, резидентные БД, OLAP, SAP.

Характеристики одного шасси (5U):

  • CPU: четыре Intel® Xeon® 6700P, до 86 ядер каждый;
  • RAM: 64 слота DDR5, до 256 ГБ на модуль, до 16 ТБ на шасси;
  • масштабирование: до четырех шасси в одну систему, 16 CPU и 64 ТБ RAM; интерконнект через внешний контроллер узлов;
  • хранение: до 24 E3.S NVMe;
  • расширение PCIe 5.0;
  • сеть: 1 GbE + 10/25 GbE SFP28;
  • питание: блоки 2400 Вт (80 Plus Titanium), горячая замена.

HPE называет 3250 первым масштабируемым сервером на Xeon 6 с модульной архитектурой в своем классе и первой системой, прошедшей валидацию в SAP BW при 48+ ТБ RAM. Конкурент от Eviden™ Bullsequana™ SH предлагает схожий класс, но с другим конструктивом.

Firefly CSC2-N48SPK3 — 48 узлов RISC-V в 2U

Промышленный стоечный сервер Firefly CSC2-N48SPK3 в гладком металлическом корпусе серебристого цвета. На передней панели расположены монтажные ушки с ручками, четыре вентиляционные решетки, небольшой ЖК-дисплей и порты ввода-вывода.
Сервер Firefly CSC2-N48SPK3. Источник.

Firefly показала многоузловой сервер CSC2-N48SPK3 на архитектуре RISC-V. Суммарная производительность заявлена на уровне 2880 TOPS (INT4). Для RISC-V это событие.

Характеристики:

  • форм-фактор: 2U, 48 вычислительных узлов;
  • процессор узла: SpacemiT™ Key Stone K3, 8 x 64-бит ядер RISC-V X100M, до 2,4 ГГц;
  • RAM на узел: 8 / 16 / 32 ГБ LPDDR5;
  • хранение на узел: 128 ГБ UFS 2.2;
  • поддержка профиля RVA23 полностью;
  • узел управления: Rockchip® RK3588  4 Cortex®-A76 (2,4 ГГц) + 4 Cortex-A55 (1,8 ГГц), Mali™-G610, NPU 6 TOPS, 8 ГБ RAM;
  • суммарная производительность: 2880 TOPS (INT4);
  • сеть: 4 × 10 GbE SFP+;
  • хранение опционально: до 48 × M.2 2280 NVMe PCIe; при дисках 16 ТБ — до 768 ТБ суммарно.

Платформа интересна прежде всего как демонстрация жизнеспособности RISC-V в серверном сегменте — не Arm и не x86, но уже работающая железка с ценником. Для продакшн-нагрузок пока скорее эксперимент, но направление понятно: тестирование совместимости ПО на RISC-V, облачная отладка и разработка под RISC-V. В качестве эксперимента возможен инференс и виртуализация.

Медные водоблоки от UIUC — используется 3D-печать 

Квадратная медная пластина, на поверхности которой вырезана сетка из множества мелких выступающих штырьков для увеличения площади теплообмена.
Медный радиатор охлаждения. Источник.

Исследователи из Иллинойского университета (UIUC) совместно с компанией Fabric8Labs представили новую технологию охлаждающих пластин для СЖО в дата-центрах. Повод заняться этим простой: большинство производителей водоблоков экономят на меди и берут алюминиевые сплавы — они дешевле в обработке, но хуже отводят тепло.

Что сделали:

  • Метод проектирования: топологическая оптимизация — алгоритм итерационно меняет геометрию ребер, на каждом шаге оценивая теплоотвод и гидравлическое сопротивление.
  • Результирующая форма ребер: заостренные вершины и зазубренные края (вместо классических параллелепипедов, конусов или цилиндров).
  • Материал: чистая медь.
  • Технология изготовления: ECAM™ (электрохимическое аддитивное производство, 3D-печать металлом) — точность 30–50 мкм, меньше толщины волоса.
  • Прирост эффективности охлаждения: +32% по сравнению с традиционными ребрами-параллелепипедами.

Потребление энергии СЖО с такими пластинами оценивается в 1,1% от общего потребления ЦОД. Для сравнения: воздушное охлаждение тратит до 30%, обычные СЖО — 5–15%. 

О сроках коммерциализации пока ничего конкретного. Fabric8Labs ранее уже предлагала похожие водоблоки с гироидными структурами. Microsoft и Corintis идут еще дальше, они хотят формировать каналы для охлаждающей жидкости прямо на поверхности чипов, без отдельного водоблока вообще.

PCIe 8.0 v0.5 — 256 ГТ/с на горизонте 2028 года

Инфографика с таблицей скоростей интерфейса PCIe. Строки представляют версии поколений от 1.x до 8.x с указанием гигатранзакций в секунду (GT/s). Столбцы показывают количество линий: x1, x2, x4, x8 и x16. Каждая ячейка содержит скорость передачи данных в ГБ/с, например, PCIe 4.0 x16 обеспечивает 64 GB/S, а PCIe 8.0 x16 — 1 TB/S.
Сравнительная таблица скоростей PCI Express (PCIe) разных поколений. Источник.

Новость не про физическое устройство, но важная для индустрии.

PCI-SIG опубликовала версию 0.5 спецификации PCIe 8.0, первый официальный вариант с учетом правок по итогам прошлогоднего релиза 0.3. Финальная версия ожидается к 2028 году.

Цели стандарта PCIe 8.0:

  • Скорость передачи: 256 ГТ/с (вдвое быстрее PCIe 7.0, вчетверо быстрее актуального PCIe 6.0).
  • Максимальная пропускная способность x16: до 1 ТБ/с при двустороннем обмене.
  • Оценка новых конструкций коннекторов.
  • Снижение энергопотребления через обновленные техники управления питанием.
  • Улучшение протоколов для увеличения эффективной пропускной способности.
  • Обратная совместимость со всеми предыдущими поколениями PCIe.

Для контекста: серверные CPU AMD и Intel только добираются до поддержки PCIe 6.0, PCIe 7.0 у обоих в дорожных картах на ближайшие годы. PCI-SIG торопится выпустить 8.0 заранее, чтобы у рынка было время планировать инфраструктуру. С учетом того, как быстро растут аппетиты AI-систем к межчиповым интерфейсам, запас в 1 ТБ/с на x16 выглядит разумной страховкой. До реального железа еще минимум три года.