IBM Power11: обзор архитектуры нового процессора
- Ядро и SMT: почему 30 ядер здесь лучше, чем 192 там
- Компоновка кристаллов: multi-die без компромиссов
- Память: DDIMM и Active Memory Expansion
- Отказоустойчивость: что стоит за цифрой 99,9999%
- ИИ-нагрузки: Spyre и не только
- Виртуализация: LPAR и то, что вы не увидите на x86
- Сравнение поколений: откуда берётся 55%
- Как потрогать Power11 без покупки железа
Когда выходит новый Intel Xeon или AMD EPYC, рынок реагирует предсказуемо: больше ядер, выше тактовая частота, новый техпроцесс. Когда IBM выпускает новое поколение POWER — разговор идёт про другое. Power11 — это архитектурное решение для тех, кому downtime стоит денег, а не просто нервов дежурного администратора. Разберём, что именно изменилось и есть ли смысл присматриваться к этому железу.
Ядро и SMT: почему 30 ядер здесь лучше, чем 192 там
Первое, что бросается в глаза при взгляде на спецификации Power11 — скромное число ядер на сокет. Порядка 30–32 физических ядер против 96–128 у топовых EPYC Genoa или 60+ у Xeon Emerald Rapids. Для человека, привыкшего к x86-логике "больше ядер = лучше", это выглядит как шаг назад.
Но IBM идёт другим путём. Каждое ядро Power11 поддерживает до 8 аппаратных SMT-потоков (Simultaneous Multi-Threading). Итого один 30-ядерный сокет даёт 240 аппаратных потоков. Два сокета — 480. Максимальная конфигурация на 16 сокетов с 16-ядерными CPU — 2048 потоков. Это не маркетинговая арифметика, а реальная возможность держать плотные многопоточные нагрузки без деградации.
SMT-режимы в Power11 настраиваются: SMT1, SMT2, SMT4, SMT8. Для OLTP-баз данных и JVM-приложений оптимальным обычно оказывается SMT4 — меньше конкуренции за ресурсы ядра при достаточной плотности потоков. Для аналитических нагрузок и контейнерных кластеров SMT8 раскрывается полнее.
Производительность на ядро выросла примерно на 55% относительно Power9 — это не маркетинговая цифра из пресс-релиза, а результат по метрике SPECint2017_rate. Относительно Power10 прирост по общей вычислительной ёмкости системы составил около 45%.
Внутри ядра — переработанные блоки ALU и FPU, расширенные матричные и векторные инструкции для ИИ-вычислений. Глубина конвейера IBM традиционно не раскрывает публично, но микроархитектура Power11 — эволюция Power10, а не революция: IBM делает ставку на предсказуемость и стабильность, а не на рекордные частоты.
Компоновка кристаллов: multi-die без компромиссов
Power11, как и Power10, использует многокристальную компоновку — несколько die в одном CPU-корпусе. Это роднит его с AMD EPYC (chiplet-архитектура) и Intel (EMIB/Foveros), но логика здесь принципиально другая.
У AMD chiplet'ы объединяются через Infinity Fabric с измеримой латентностью межкристального обмена. У Intel EMIB — более плотная интеграция, но со своими ограничениями по топологии. IBM в multi-die POWER делает упор на унификацию доступа к памяти и минимизацию NUMA-неравномерности внутри сокета. Внутренняя шина между кристаллами у Power11 работает на значительно большей пропускной способности, чем у типичных x86 chiplet-решений, что критично для нагрузок с интенсивным межпроцессорным обменом.
При масштабировании до 16 сокетов это даёт предсказуемую топологию — важно для SAP HANA, DB2 и Oracle, где NUMA-расстояние напрямую влияет на время отклика транзакций
Память: DDIMM и Active Memory Expansion
Power11 использует DDIMM — дифференциальный модульный форм-фактор серверной оперативной памяти, разработанный IBM совместно с партнёрами. Относительно классических DIMM он даёт большую плотность, лучшую пропускную способность на канал и выше энергоэффективность. Платформа работает с DDR5, а крупные конфигурации Power E1180 поддерживают до 64 ТБ оперативной памяти в системе.
Для администраторов, которые работали с предыдущими поколениями POWER, Active Memory Expansion — знакомая технология. Она прозрачно сжимает данные в памяти на уровне железа, расширяя доступный объём без изменений в ОС или приложениях. В реальных условиях это даёт от 50% до 100% прироста "видимой" памяти при типичных enterprise-нагрузках — особенно полезно для SAP и in-memory баз данных.
| Параметр | Power9 | Power10 | Power11 |
|---|---|---|---|
| Тип памяти | DDR4 / CDIMM | DDR4 / DDIMM | DDR5 / DDIMM |
| Макс. объём (топ-система) | ~8 ТБ | ~64 ТБ | ~64 ТБ |
| SMT-потоков на ядро | до 8 | до 8 | до 8 |
| Прирост производительности/ядро | база | ~25% к Power9 | ~55% к Power9 |
| Энергоэффективность vs x86 | — | — | ~2x vs Xeon Emerald Rapids |
Отказоустойчивость: что стоит за цифрой 99,9999%
Шесть девяток — это 31 секунда незапланированного downtime в год. Звучит как фантастика, но IBM закладывает её не через маркетинговые декларации, а через конкретные аппаратные механизмы.
Первое — резервные ядра. Часть физических ядер процессора изначально скрыта от пользователя и ОС. При деградации или отказе одного из активных ядер система автоматически активирует резервное. Никакой замены CPU, никакого простоя — нагрузка переехала сама, предиктивная система уже отправила алерт в IBM Support.
Второе — аппаратная коррекция ошибок на всех уровнях: кэш, память, шины. Система обнаруживает проблему до того, как она приведёт к сбою. Третье — предиктивное обслуживание через IBM Support: телеметрия с сервера уходит в IBM ещё до того, как проблема проявится симптомами.
Power Cyber Vault — встроенный механизм обнаружения ransomware-атак. Время детектирования — менее одной минуты. Интеграция с IBM Concert позволяет автоматически изолировать скомпрометированные данные и запустить процедуру восстановления без участия администратора.
ИИ-нагрузки: Spyre и не только
IBM не стала ждать, пока рынок определится с тем, нужны ли GPU в enterprise-серверах. Power11 поддерживает специализированный ускоритель Spyre — PCIe-плата с до 32 ИИ-ядрами и 1 ТБ собственной памяти. Архитектурно Spyre родственен ускорителям Telum II, которые IBM разрабатывает для мейнфреймов z16.
Целевые нагрузки Spyre — inference для LLM-моделей, ML-аналитика, обработка документов в реальном времени. Не обучение нейросетей с нуля (для этого нужен NVIDIA H100 или A100 — подробнее о том, как выбрать и собрать сервер под задачи ИИ), а production-inference с предсказуемой латентностью. Для банков и страховых компаний, которым нужно скорить кредитные заявки за 50 мс — это вполне конкретный сценарий.
Что делает Spyre интересным с архитектурной точки зрения — это не просто GPU-замена. У него 1 ТБ собственной памяти на плате, что снимает одно из главных ограничений GPU-inference: необходимость загружать большие модели через шину при каждом батче. Spyre держит модель в памяти постоянно, что критично для latency-sensitive приложений.
На уровне программного стека Power11 плотно интегрирован с Red Hat: RHEL и OpenShift официально поддерживаются, Docker и Podman работают на ppc64le без сюрпризов. IBM watsonx доступен как платформа для ИИ-нагрузок прямо на этом железе. Power Virtual Server сертифицирован как гипермасштабируемая платформа для RISE with SAP — то есть если у вас SAP-ландшафт и вы думаете о переходе на RISE, Power11 в IBM Cloud уже готов к этому сценарию.
Виртуализация: LPAR и то, что вы не увидите на x86
PowerVM — гипервизор IBM для POWER-платформы — это не "ещё один гипервизор". Micro-partitioning позволяет нарезать ресурсы CPU с шагом 0,1 ядра. Один физический сервер может держать десятки LPAR (логических разделов) с гарантированными квотами CPU, изоляцией памяти и возможностью live migration без деградации.
Для администраторов, выбирающих между популярными гипервизорами или переходящих с VMware или KVM на PowerVM, важно понять разницу в модели: LPAR — это не просто виртуальная машина. Это логический раздел с прямым доступом к физическим ресурсам, где гипервизор вмешивается минимально. Shared Processor Pools позволяют группировать LPAR по приоритетам и политикам потребления, а не просто выставлять лимиты vCPU. Dedicated LPAR даёт физическое ядро целиком — без соседей, без шума.
Сравнение с распространёнными альтернативами:
| Характеристика | PowerVM (Power11) | VMware vSphere | KVM (x86) |
|---|---|---|---|
| Минимальный шаг CPU | 0,1 ядра | 1 vCPU | 1 vCPU |
| Live migration | Да, без downtime | Да (vMotion) | Да (с ограничениями) |
| CPU oversubscription | Да, управляемый | Да | Да |
| Встроенная HA | Аппаратная | Программная (vSphere HA) | Требует доп. инструментов |
| Изоляция нагрузок | LPAR-уровень | VM-уровень | VM-уровень |
PowerVC — надстройка над PowerVM с REST API, интеграцией в OpenStack и поддержкой Terraform. Для команд, которые живут в IaC, это не экзотика.
Отдельная тема — I/O подсистема. Power11 поддерживает PCIe 5.0, что открывает возможности для подключения NVMe-массивов с пропускной способностью до 128 ГБ/с на сокет и 400G-сетевых адаптеров. SR-IOV поддерживается нативно, виртуализация сетевых устройств работает на уровне гипервизора без программного overhead. Для SAN-подключений — стандартный Fibre Channel через адаптеры от Broadcom и Marvell, ничего экзотического.
Сравнение поколений: откуда берётся 55%
Цифры прироста производительности Power11 относительно Power9 звучат внушительно. Но что за ними стоит конкретно?
Power9 → Power10: переход на более тонкий техпроцесс (7 нм IBM), первое появление DDIMM, расширенные инструкции для шифрования. Прирост производительности на ядро — порядка 25%.
Power10 → Power11: переработанная микроархитектура ядра с улучшенными матричными блоками, DDR5 вместо DDR4, новые режимы энергосбережения. Прирост ещё порядка 25–30% к Power10, итого — около 55% к Power9 по SPECint2017_rate.
Отдельного внимания заслуживает режим энергосбережения Power11. IBM заявляет, что при активации специального power-saving режима можно получить до 28% лучшей энергоэффективности, пожертвовав небольшой долей частоты. Для дата-центров, где электричество — вторая по величине статья расходов после железа, это не мелочь. В пересчёте на ватт производительность Power11 вдвое превосходит сопоставимые x86-системы на Xeon Emerald Rapids по метрике SPECint2017_rate.
Линейка серверов Power11 охватывает широкий диапазон: от компактного Power S1012 начального уровня (один сокет, до 16 ядер) до флагмана Power E1180 с поддержкой 16 сокетов, 256 физическими ядрами и 2048 аппаратными потоками.
| Модель | Сокеты | Макс. ядер | Макс. потоков | Позиционирование |
|---|---|---|---|---|
| Power S1012 | 1 | 16 | 128 | Начальный уровень, edge |
| Power S1122 | 2 | 64 | 512 | Mid-range enterprise |
| Power E1150 | 4 | 128 | 1024 | Крупные корпоративные нагрузки |
| Power E1180 | 16 | 256 | 2048 | Флагман, ИИ, критичные системы |
Как потрогать Power11 без покупки железа
Стойку Power E1180 в офис не поставишь для теста. Но IBM предоставляет доступ через IBM Cloud — Power Virtual Server доступен как PaaS-сервис с почасовой оплатой. Там же можно развернуть RHEL или IBM i, поиграть с LPAR и оценить реальную производительность на своих нагрузках.
Практический сценарий: берёте Power Virtual Server в IBM Cloud, разворачиваете RHEL 9 на ppc64le, запускаете свой Java-стек или базу данных и смотрите на TPS. Если результаты интересные — идёте к IBM с разговором о железе. Если нет — потратили несколько часов и минимальный бюджет на облако.
Для PoC-тестирования IBM предлагает программу Technology Expert Labs — это консультанты и временный доступ к железу для оценки миграции. Не бесплатно, но для enterprise-решений это стандартная практика.
Kubernetes на ppc64le поддерживается официально, образы для основных дистрибутивов доступны. Terraform-провайдер для IBM Cloud позволяет автоматизировать развёртывание Power Virtual Server так же, как любую другую облачную инфраструктуру. RISC-архитектура на ppc64le имеет свои нюансы в компиляции и зависимостях, но для основных стеков — Java, Python, Go, Node.js — это давно решённый вопрос.
Серверы IBM Power11 — это не ответ на вопрос "какой процессор быстрее". Это ответ на другой вопрос: что происходит, когда ваша база данных не может позволить себе даже минуту простоя, а нагрузка растёт быстрее, чем вы успеваете добавлять узлы. RISC-архитектура с глубоким SMT, предиктивной отказоустойчивостью и встроенными ИИ-ускорителями — инженерный выбор, который делается не вопреки x86, а параллельно с ним, для другого класса задач. Если ваши задачи попадают в этот класс — разговор о железе стоит начать.


