Для чего нужна видеокарта?
- Устройство
- Характеристики
- Типы графических карт
- Программное обеспечение
- Использование видеокарт в майнинге криптовалют
- 3D-ускорители
- Графический процессор
- Видеопамять
- Видеоконтроллер
- Видео-ПЗУ
- Интерфейс
- Коннектор
- Система охлаждения
- Дискретные видеокарты
- Встроенная графика
- Гибридные решения
- GPGPU
- Внешние видеокарты
- Драйвер устройства
Видеокарта в сервере — это не про игры и не про красивые обои на рабочем столе. Это вычислительный ресурс: инференс нейросетей, рендеринг, VDI, обработка видеопотоков. GPU превратился из «железки для картинки» в полноценный ускоритель, без которого ряд серверных задач просто не решается за адекватное время.
Большинству серверов GPU не нужен — файловый сервер или контроллер домена прекрасно живёт на встроенной графике BMC. Но если речь о VDI-ферме, инференсе LLM, научных вычислениях или видеоаналитике — без дискретного GPU сервер просто бесполезен. NVIDIA H100/H200, AMD Instinct MI300X, Intel Gaudi 3 — это процессоры-ускорители, которые стоят дороже самого сервера и определяют архитектуру всего решения. Подробнее о том, как подобрать и собрать сервер под задачи ИИ, — в отдельном материале.
Устройство
Серверная видеокарта устроена проще потребительской (нет пяти разъёмов HDMI и RGB-подсветки), но каждый элемент рассчитан на круглосуточную работу:
- GPU — чип-ускоритель. В серверном сегменте это NVIDIA H100/H200/B100, AMD Instinct MI300X, Intel Gaudi. Архитектура заточена под параллельные вычисления, а не под растеризацию полигонов.
- VRAM (HBM3/HBM3e) — высокоскоростная память с пропускной способностью до 4,8 ТБ/с (HBM3e). Именно объём VRAM определяет, поместится ли модель нейросети в память одного GPU или придётся распараллеливать на кластер.
- Шина (PCIe 5.0 / NVLink) — интерфейс связи GPU с CPU и между GPU. NVLink 4.0 даёт до 900 ГБ/с между ускорителями — на порядок быстрее PCIe.
- Видеовыходы — в серверных ускорителях их часто нет вовсе. NVIDIA A100/H100 не имеют разъёмов для мониторов: управление идёт через BMC и IPMI.
- Охлаждение — пассивный радиатор (для продува воздухом в стойке) или жидкостное охлаждение для TDP свыше 350 Вт.
Характеристики
На что смотреть при выборе серверного GPU:
- VRAM и тип памяти — для инференса LLM с 70B+ параметрами нужно от 80 ГБ HBM3. GDDR6X подходит для задач попроще: VDI, рендеринг.
- Тензорные ядра (Tensor Cores / Matrix Cores) — специализированные блоки для операций с матрицами. Именно они определяют скорость обучения и инференса нейросетей, а не тактовая частота.
- Пропускная способность памяти — измеряется в ТБ/с. NVIDIA H200 выдаёт 4,8 ТБ/с на HBM3e, что критично для задач, упирающихся в bandwidth.
- TDP (теплопакет) — серверные ускорители потребляют 300–700 Вт. Это влияет на выбор блока питания, системы охлаждения и даже стойки.
- Межсоединения (NVLink, Infinity Fabric) — если нужен мульти-GPU кластер, пропускная способность между ускорителями важнее тактовой частоты каждого из них.
Типы графических карт
- Встроенная графика (iGPU / BMC) — есть почти в каждом серверном процессоре или реализована через контроллер управления (BMC). Хватает для BIOS, IPMI-консоли и аварийного доступа. На этом — всё.
- Дискретные ускорители — NVIDIA Tesla/H-серия, AMD Instinct, Intel Gaudi. Устанавливаются в PCIe-слоты (x16) или в специализированные шасси (HGX, OAM). Потребляют 300–700 Вт, требуют соответствующего питания и охлаждения.
- Профессиональные GPU — NVIDIA RTX A-серия (A4000, A6000) и AMD Radeon PRO. Заточены под САПР, рендеринг, VDI. Сертифицированы для работы с ISV-приложениями (Autodesk, Siemens NX, SolidWorks).
Конфигурация сервера под GPU-задачи — нетривиальная история: нужно учесть совместимость шасси, мощность БП, количество PCIe-линий и теплоотвод. Проще всего рассчитать стоимость сервера через конфигуратор, где зависимости между компонентами уже заложены.
Программное обеспечение
GPU без софтового стека — кусок кремния. Экосистема решает: CUDA (NVIDIA), ROCm (AMD), oneAPI (Intel). CUDA доминирует — большинство ML-фреймворков (PyTorch, TensorFlow, vLLM) оптимизированы под неё в первую очередь. ROCm догоняет, но совместимость с конкретными моделями и библиотеками лучше проверять до покупки.
Драйверы в серверах — отдельная дисциплина. NVIDIA предлагает два варианта: стандартные драйверы и NVIDIA AI Enterprise (лицензируется отдельно). Для VMware vSphere, Proxmox и KVM-гипервизоров нужны vGPU-драйверы, позволяющие «нарезать» физический GPU на виртуальные профили. Если вы ещё не определились с платформой виртуализации, поможет сравнение популярных гипервизоров.
Использование видеокарт в майнинге криптовалют
После перехода Ethereum на Proof-of-Stake в 2022 году GPU-майнинг потерял экономический смысл для большинства криптовалют. Основные монеты либо ушли на ASIC (Bitcoin давно), либо перешли на PoS. Оставшиеся PoW-монеты, майнящиеся на GPU (Ravencoin, Ergo, Kaspa), приносят копейки при стоимости электричества выше $0,05/кВт·ч.
Если GPU-мощности уже есть — их выгоднее перепрофилировать: сдавать в аренду под ML-инференс (через платформы вроде Vast.ai или RunPod), использовать для рендер-ферм или видеотранскодинга. Окупаемость в этих сценариях предсказуемее, чем в майнинге.
3D-ускорители
Термин «3D-ускоритель» пришёл из 90-х, но суть осталась: аппаратное ускорение рендеринга полигонов, шейдеров, текстур. В серверной среде это нужно для VDI (когда сотни пользователей работают в AutoCAD или 3ds Max через тонкие клиенты) и для рендер-ферм (Blender, V-Ray, KeyShot). NVIDIA RTX A-серия и vGPU-профили позволяют разделить один физический GPU между 4–16 виртуальными рабочими столами — каждый получает свой кусок VRAM и вычислительных ресурсов.
Графический процессор
GPU содержит тысячи вычислительных ядер, работающих параллельно. NVIDIA H100 — 16 896 CUDA-ядер и 528 тензорных ядер. AMD MI300X — 304 вычислительных блока. Эта архитектура заточена под SIMD-операции: перемножение матриц, свёртки, операции с векторами. Отсюда и взрывной рост применения GPU в ML, молекулярной динамике, финансовом моделировании и генеративном AI.
Видеопамять
Объём VRAM — часто узкое место. Модель LLaMA 3.1 70B в формате FP16 занимает ~140 ГБ, а значит не помещается ни в один GPU целиком (у H100 — 80 ГБ HBM3). Приходится либо использовать квантизацию (INT8/INT4), либо распределять модель на 2–4 GPU через tensor parallelism.
Типы памяти в серверных GPU: HBM3/HBM3e — для ускорителей верхнего сегмента (H100, H200, MI300X), GDDR6X — для профессиональных карт (RTX A6000, 48 ГБ). Разница в пропускной способности — в разы: HBM3e даёт до 4,8 ТБ/с против ~1 ТБ/с у GDDR6X.

Видеоконтроллер
Видеоконтроллер — часть графической карты, управляющей выводом графических данных на монитор. В контексте серверов, где дисплейная подсистема может не быть приоритетом, видеоконтроллер обычно обеспечивает базовые функции отображения для мониторинга и управления сервером.
Видео-ПЗУ
Видео-ПЗУ — это постоянное хранилище на видеокарте, содержащее прошивку, которая инициализирует видеокарту при старте сервера. Это ПЗУ также может содержать базовые алгоритмы и функции для работы графической подсистемы до загрузки основных драйверов операционной системы.
Интерфейс
Два варианта подключения серверных GPU:
- PCIe 5.0 x16 — стандарт для одиночных ускорителей. Пропускная способность — до 64 ГБ/с (в каждую сторону). PCIe 6.0 уже специфицирован и появляется в новых платформах, удваивая bandwidth до 128 ГБ/с.
- SXM / OAM — проприетарные разъёмы для базовых плат HGX (NVIDIA) и OCP Accelerator Module. Через них GPU подключается к NVLink-фабрике и получает межсоединения со скоростью 900 ГБ/с (NVLink 4.0). Это стандарт для AI-кластеров, где 4–8 GPU в одном узле обмениваются данными напрямую, минуя CPU.
AGP, PCI и прочие интерфейсы из 2000-х — музейные экспонаты. Если ваш сервер поддерживает только PCI-X, задумайтесь не о видеокарте, а о замене платформы.
Коннектор
Коннектор на видеокарте определяет, как видеокарта будет подключаться к внешним устройствам или дисплеям. В случае с серверами, где графический вывод может не являться основным приоритетом, обычные коннекторы могут иметь тип VGA и DVI. Однако некоторые современные серверные конфигурации могут иметь порты HDMI или DisplayPort для улучшенного качества графической передачи, если требуется заказчику.
Система охлаждения
Серверный GPU с TDP 700 Вт (NVIDIA B200) — это утюг, работающий круглосуточно. Охлаждение тут не опция, а инженерная задача номер один.
Два подхода: воздушное и жидкостное. Воздушное — пассивный радиатор + продувка корпусными вентиляторами серверного шасси. Работает до TDP ~350 Вт. Выше — нужно жидкостное охлаждение (direct-to-chip или иммерсионное). Разница в плотности размещения колоссальная: с жидкостным охлаждением в одну стойку помещается вдвое-втрое больше ускорителей.
Проектировать GPU-сервер стоит от теплоотвода: сначала считаете суммарный TDP, потом подбираете шасси и систему кондиционирования ЦОД. Не наоборот.
Дискретные видеокарты
Это отдельные устройства, устанавливаемые в слоты расширения сервера. Устройства такого типа обычно имеют лучшую производительность по сравнению со встроенными графическими решениями и применяются в серверах, где нужна высокая графическая мощность или реализация соответствующих вычислительных процессов.
Встроенная графика
Встроенная графика означает, что графический контроллер интегрирован непосредственно в ЦП или материнскую плату сервера. Это решение часто используется в бюджетных или энергоэффективных серверах, где графическая производительность не является приоритетом. Встроенная графика обычно потребляет меньше энергии и требует меньше пространства по сравнению с дискретными видеокартами.
Гибридные решения
Гибридные решения сочетают в себе характеристики встроенной графики и дискретных видеокарт. В контексте серверов это может позволить оптимизировать производительность и энергопотребление, предоставляя графическую мощь при необходимости и переключаясь на более экономичную встроенную графику при отсутствии графически интенсивных задач.
GPGPU
GPGPU — использование GPU для вычислений общего назначения, не связанных с графикой. По сути, весь AI/ML-бум построен на этой концепции. Фреймворки: CUDA (NVIDIA), ROCm (AMD), oneAPI (Intel), OpenCL (кроссплатформенный). Задачи: обучение нейросетей, инференс, молекулярная динамика, геномика и HPC-вычисления, обработка сигналов, финансовое моделирование (Монте-Карло). Один GPU-сервер с 8× H100 заменяет десятки CPU-серверов на задачах матричной алгебры.
Внешние видеокарты
eGPU через Thunderbolt — это история про ноутбуки и рабочие станции, а не про серверы. В серверной среде аналогом выступают GPU-полки (NVIDIA DGX, JBOG-корзины), подключаемые к серверу по PCIe-фабрике или NVLink. Такие решения позволяют масштабировать GPU-ресурсы без замены самого сервера, но стоят как чугунный мост и требуют отдельного питания и охлаждения.
Драйвер устройства
Драйвер — прослойка между ОС и GPU. Серверные драйверы отличаются от десктопных: у NVIDIA это ветка «Data Center Driver» (отдельная от GeForce), у AMD — специализированная сборка ROCm. Обновления выходят реже, но проходят расширенное тестирование. Перед обновлением драйвера на продакшн-сервере — тестируйте на стенде. Это не паранойя, а здравый смысл: некорректный драйвер положит все GPU-задачи разом.
Если нужна помощь с подбором видеокарты под конкретное серверное решение — обратитесь к специалистам: задача нетривиальная, и ошибка в выборе GPU обходится дорого (и в деньгах, и во времени).


