NVIDIA Blackwell RTX Pro 5000: видеокарта с 72 ГБ памяти для профи
Октябрь 2025-го. NVIDIA обновляет страницу продукта, добавляет пару строк в даташит — и всё. Ни пресс-релиза, ни помпезной презентации Дженсена Хуанга в кожаной куртке. Просто тихо появилась версия RTX PRO 5000 Blackwell с 72 ГБ GDDR7. Для карты ценой под 540 000–690 000 ₽ — странный ход. Или, наоборот, уверенный: когда продукт не нуждается в рекламе, его покупают и так.
Давайте разберёмся, что NVIDIA положила внутрь, кому это нужно и стоит ли вообще смотреть в сторону 72-гигабайтной версии, если 48 ГБ уже есть на рынке.
Что под капотом: спецификация без воды
RTX PRO 5000 Blackwell 72 ГБ — это, по сути, та же карта, что и 48-гигабайтная версия, но с увеличенным объёмом видеопамяти. Чип GB202, архитектура Blackwell, 14 080 CUDA-ядер. Тензорные ядра пятого поколения, RT-ядра четвёртого. TDP — 300 Вт, интерфейс PCIe 5.0 x16, blower-кулер, двухслотовый форм-фактор длиной 267 мм.
Память — GDDR7 с поддержкой ECC. В 48-гигабайтной версии стоят 16 чипов по 3 ГБ, в 72-гигабайтной — 24 чипа по 3 ГБ в конфигурации clamshell (чипы с обеих сторон подложки). Шина — 384 бит, пропускная способность — 1 344 ГБ/с у обеих версий. Да, даташит NVIDIA указывает 512 бит, но это ошибка в документации — независимые источники подтвердили 384-битную шину с модулями на 28 Гбит/с.
| Параметр | RTX PRO 5000 (48 ГБ) | RTX PRO 5000 (72 ГБ) | RTX PRO 6000 (96 ГБ) |
|---|---|---|---|
| GPU | GB202, Blackwell | GB202, Blackwell | GB202, Blackwell |
| CUDA-ядра | 14 080 | 14 080 | 24 064 |
| Тензорные ядра | 5-го поколения | 5-го поколения | 5-го поколения |
| RT-ядра | 4-го поколения | 4-го поколения | 4-го поколения |
| Память | 48 ГБ GDDR7 ECC | 72 ГБ GDDR7 ECC | 96 ГБ GDDR7 ECC |
| Шина памяти | 384 бит | 384 бит | 512 бит |
| Пропускная способность | 1 344 ГБ/с | 1 344 ГБ/с | 1 792 ГБ/с |
| AI TOPS | 2 064 | 2 064 (2 142*) | ~3 300 |
| FP32, TFLOPS | 65 | 65 | ~100 |
| TDP | 300 Вт | 300 Вт | 600 Вт |
| MIG | 2× 24 ГБ | 2× 36 ГБ | — |
| Цена (ориентир.) | 325 000–355 000 ₽ | 540 000–690 000 ₽ | от 640 000 ₽ |
*NVIDIA указывает 2 142 TOPS в отдельных материалах для 72 ГБ версии; разница с 48 ГБ вариантом может объясняться методологией тестирования.
Три видеовыхода DisplayPort 2.1b, поддержка до четырёх мониторов 4K@120 Гц или двух 8K@60 Гц. Три энкодера NVENC девятого поколения и три декодера NVDEC шестого — для работы с видео этого хватает с запасом.
Рендеринг: где 72 ГБ реально меняют игру
NVIDIA заявляет ускорение рендеринга до 4,7× в сравнении с предыдущим поколением Ada Lovelace. Цифра красивая, но без уточнения конкретных сцен и конфигураций воспринимать её стоит как потолок, а не среднее значение. Карта протестирована с Arnold, V-Ray, Blender Cycles, D5 Render и Redshift.
Реальная ценность 72 ГБ раскрывается не в скорости рендера (тут обе версии идентичны — одинаковое количество ядер, одинаковые частоты), а в объёме сцен, которые можно обрабатывать без выгрузки данных в системную память. Когда сцена в Blender или Cinema 4D перерастает 48 ГБ VRAM — а при работе с 8K-текстурами, тяжёлой геометрией и симуляциями частиц это не такая уж экзотика — GPU начинает «лазить» в RAM через PCIe. Производительность проседает кратно.
В SPECviewperf 2020 результат составил 98,9 баллов — улучшение на 40–50% относительно карт на Ada Lovelace. Для CAD и инженерного ПО (SolidWorks, CATIA, Siemens NX) NVIDIA обещает двукратный прирост графической производительности.
72 ГБ — это про свободу работы с тяжёлыми проектами. Архитектурная визуализация с миллионами полигонов, VFX-пайплайны с AI-денойзерами, виртуальное производство (virtual production) на Unreal Engine 5 — везде, где данные должны лежать в VRAM целиком, дополнительные 24 ГБ решают.
Отдельно про neural rendering — новая технология RTX Mega Geometry позволяет обрабатывать до 100× больше ray-traced треугольников. Вместе с нейросетевыми шейдерами (Neural Shaders), встроенными прямо в пайплайн программируемых шейдеров, это даёт качественный скачок в реалтайм-визуализации. DLSS 4 с Multi Frame Generation тоже на борту — полезно для интерактивного превью сложных сцен без финального рендера.
ИИ и инференс: зачем это вашей рабочей станции
2 064 TOPS в INT8 — это не маркетинговая абстракция, а вполне практичная характеристика. На 72 ГБ VRAM поместится модель Llama 3 70B в квантизации INT4 (около 35–40 ГБ), что позволяет запускать её локально без облака. На 48-гигабайтной версии та же модель уже не влезает — приходится либо резать контекст, либо использовать агрессивную квантизацию, либо смотреть в сторону облачных GPU. Если вы только выстраиваете инфраструктуру для AI-задач, рекомендуем изучить, как выбрать и собрать сервер для ИИ под реальные задачи.
Если сравнивать с H100 (80 ГБ HBM3, ~1 900 000–2 300 000 ₽ за карту), RTX PRO 5000 проигрывает по пропускной способности памяти (1 344 ГБ/с против 3 350 ГБ/с) и чистой вычислительной мощности, но для локального инференса и fine-tuning моделей до 70B параметров — это рабочий инструмент за разумные деньги.
Интеграция с TensorRT и CUDA 12.x делает карту родной для экосистемы NVIDIA. Stable Diffusion XL, Flux, локальные ассистенты на базе LLM — всё это работает без танцев с бубном. По данным NVIDIA, производительность в генерации изображений выросла в 3,5× относительно предыдущего поколения, а в генерации текста — в 2×.
Поддержка FP4-точности в тензорных ядрах пятого поколения — ещё один козырь для инференса. FP4 позволяет запускать модели с меньшим потреблением памяти и энергии при минимальной потере качества. Для RAG-пайплайнов (Retrieval-Augmented Generation), где нужно держать в памяти и саму модель, и индекс базы знаний, 72 ГБ — комфортный объём. На 48 ГБ приходилось бы постоянно жонглировать между моделью и контекстом.
Виртуализация и серверная интеграция
RTX PRO 5000 поддерживает NVIDIA vGPU, что позволяет использовать карту в инфраструктуре VMware vSphere и других гипервизорах — если вы ещё не определились с платформой виртуализации, полезно изучить сравнение гипервизоров с подробным разбором. Multi-Instance GPU (MIG) работает в двух режимах: один инстанс на полный объём (72 ГБ) или два изолированных инстанса по 36 ГБ с собственными потоковыми процессорами, кэшем и гарантированным QoS.
Для серверных рабочих станций (Dell Precision, HPE Z-серия, Lenovo ThinkStation) карта вписывается хорошо: 300 Вт TDP, blower-кулер, двухслотовый форм-фактор. Это не 600 Вт, как у RTX PRO 6000, — не нужно перепроектировать охлаждение всего шасси. Одна-две карты в рабочую станцию ставятся без проблем.
Мониторинг через NVIDIA DCGM и интеграция с Prometheus позволяют отслеживать загрузку VRAM, температуру ядра, утилизацию тензорных ядер и прочие метрики. ECC-память — обязательный атрибут для 24/7 нагрузок: битовые ошибки при длительном инференсе или рендеринге корруптят результаты молча, и без ECC Вы узнаете об этом постфактум.
Лицензирование vGPU (NVIDIA vPC и vWS) — отдельная статья расходов, о которой стоит помнить при планировании бюджета. Без лицензии карта работает в passthrough-режиме (один GPU — одна виртуальная машина), а для деления GPU между несколькими пользователями или VDI-сессиями придётся платить за подписку. Для ИТ-отделов с требованиями compliance карта поддерживает RBAC и аудит через NVIDIA Enterprise AI.
Конкуренты: выбор не такой очевидный
Покупка профессиональной видеокарты для рендеринга — это не столько про «какая быстрее», сколько про «какая решает мою задачу за адекватные деньги». Вот как выглядит расклад:
| Параметр | RTX PRO 5000 72 ГБ | RTX 6000 Ada (48 ГБ) | AMD Radeon PRO W7900 (48 ГБ) |
|---|---|---|---|
| Архитектура | Blackwell, 5 нм | Ada Lovelace, 5 нм | RDNA 3, 5 нм |
| VRAM | 72 ГБ GDDR7 ECC | 48 ГБ GDDR6 ECC | 48 ГБ GDDR6 |
| Шина | 384 бит | 384 бит | 384 бит |
| Пропускная способность | 1 344 ГБ/с | 960 ГБ/с | 864 ГБ/с |
| TDP | 300 Вт | 300 Вт | 295 Вт |
| AI TOPS | 2 064 | ~1 300 | — |
| Цена | 540 000–690 000 ₽ | 385 000–540 000 ₽ | 270 000–310 000 ₽ |
RTX 6000 Ada — проверенная рабочая лошадка. В тестах Puget Systems на Blender, V-Ray и DaVinci Resolve она отстаёт от Blackwell-поколения, но 48 ГБ GDDR6 хватает для абсолютного большинства задач. Если Ваши сцены укладываются в этот объём, а ИИ-инференс не в приоритете — RTX 6000 Ada обойдётся дешевле.
AMD Radeon PRO W7900 — интересный вариант по соотношению цена/производительность. В чистом рендеринге разрыв с NVIDIA не катастрофический (около 2–9% в пользу NVIDIA в агрегированных бенчмарках), но в ИИ-задачах экосистема AMD (ROCm) всё ещё уступает CUDA по зрелости и поддержке софта. Подробнее о том, что выгоднее для бизнеса — Intel или AMD, читайте в отдельном материале. Если Ваш пайплайн не завязан на TensorRT и CUDA — W7900 за ~270 000 ₽ заслуживает внимания.
RTX PRO 6000 Blackwell (96 ГБ, 512 бит, 1 792 ГБ/с, ~24 064 ядра) — флагман. Но 600 Вт TDP и цена от 640 000 ₽ делают её решением для тех, кому 72 ГБ объективно мало.
Экономика: облако или железо
Вечный вопрос: купить карту или арендовать GPU в облаке? Грубая арифметика.
Аренда одного GPU-инстанса уровня A100/H100 в AWS (G5/P4d) обходится в 230–615 ₽ за час. Допустим, Вы используете GPU 8 часов в день, 22 рабочих дня в месяц. Минимальная стоимость — ~40 500 ₽/мес, или ~488 000 ₽/год. За два года — ~976 000 ₽. Карта RTX PRO 5000 72 ГБ за ~540 000–690 000 ₽ окупается за 14–18 месяцев при таком сценарии использования.
Добавьте сюда стоимость электричества (300 Вт × 8 ч × 22 дня = ~53 кВт·ч/мес, что обойдётся примерно в 300–500 ₽ по российским тарифам), и ROI всё равно сходится. Плюс бонусы: данные остаются локально, нет задержек, нет зависимости от провайдера.
Масштабирование тоже стоит продумать. MIG позволяет утилизировать карту полнее, если у Вас разнородные задачи. А для действительно тяжёлых нагрузок (кластер из 4–8 GPU) разумнее смотреть на RTX PRO 6000 или серверные решения — экономия на масштабе будет ощутимее. NVLink в десктопных конфигурациях RTX PRO 5000 не поддерживается, так что multi-GPU работает через PCIe — для рендеринга это приемлемо, а вот для распределённого обучения моделей лучше смотреть в серверный сегмент.
Кому покупать, а кому — нет
RTX PRO 5000 Blackwell 72 ГБ — это нишевый инструмент. Нишевый — не значит плохой. Это значит, что карта решает конкретные задачи лучше альтернатив:
Если Вы работаете с тяжёлыми 3D-сценами, где 48 ГБ VRAM не хватает — 72 ГБ закрывают проблему без перехода на 600-ваттный RTX PRO 6000. Если Вам нужен локальный инференс LLM от 30B до 70B параметров с полным контролем над данными — это одна из немногих десктопных карт, где модели такого размера помещаются целиком. Если Вы строите рабочую станцию с одним-двумя GPU и не хотите перепроектировать охлаждение и питание — 300 Вт TDP делают карту совместимой с большинством профессиональных шасси.
Если же Ваши сцены укладываются в 48 ГБ, а ИИ-задачи ограничиваются моделями до 13B — переплата за 72 ГБ не оправдана. Берите стандартную версию за ~325 000 ₽ и потратьте разницу на SSD или RAM.
NVIDIA сделала тихий, но точный ход. Без фанфар выпустила карту, которая закрывает конкретную дыру в линейке: между 48 ГБ (мало для тяжёлых моделей) и 96 ГБ (дорого и горячо). Для тех, кто понимает свои потребности — это видеокарта для рендеринга и ИИ-задач, которая экономит время и деньги. Для остальных — повод пересмотреть свой рабочий пайплайн и задаться вопросом: а не пора ли перенести часть ИИ-задач с облака на рабочий стол?
Доступность пока ограничена, и большинство ритейлеров оформляют карту как special order. Массовое появление через глобальных сборщиков рабочих станций NVIDIA обещает в начале 2026 года.


