Бюджетная сборка для нейросетей в Tower: 2× RTX 4090 и тест DeepSeek 70B (+ Видео обзор)
Бюджетная сборка для работы с нейросетями в tower-корпусе. Подойдёт для локального инференса LLM, генерации изображений, ML-экспериментов и корпоративного AI-чата на небольшую команду - всё без отправки данных в облако и без ежемесячных подписок.
Чтобы получить максимум за свои деньги, сборка идет на десктопных комплектующих. Это в разы дешевле серверной платформы - и под локальный инференс с упором на GPU вполне отрабатывает. Где нужны ECC-память, IPMI, hot-swap и резервирование БП - у нас есть и серверные сборки на Xeon Scalable, но это уже другой класс задач и другой бюджет. Здесь главное - чтобы корпус и питание тянули две полноразмерные видеокарты.
На видео - обзор и тест сборки на DeepSeek.
В этом тесте в корпусе стоят 2× RTX 4090 (24 ГБ каждая). У нас можно приобрести сборки также и на 2× RTX 5090 c 32 ГБ. Платформа и корпус идентичные, под RTX 5090 запас по более крупным моделям и контекстам пропорционально больше.
Корпус: два слота под полноразмерные GPU
Корпус - один из двух tower'ов на рынке, в которые свободно встают две RTX 5090 или RTX 4090.
Корпус типа Mesh (с перфорацией по всем стенкам) с большим количеством вентиляторов отлично справляется с температурами. Под инференсом DeepSeek R1 70B (загрузка GPU 48-50%) карты держат 47-50°C при термолимите 90°C - до троттлинга больше 40 градусов запаса.
БП в обзоре - 2,2 кВт, под две RTX 4090 (по 450 Вт TDP) с запасом. В версии под две RTX 5090 (по 575 Вт TDP) ставим блок на 2800 Вт - чтобы остался тот же комфортный запас на пиковые потребления и периферию.
Кому подойдёт
- Локальный LLM - Llama, DeepSeek, Qwen, Mistral. Суммарный объём видеопамяти - 48 ГБ на 4090, 64 ГБ на 5090 - с квантизацией Q4-Q8 влезают модели на 70-100+ миллиардов параметров
- Stable Diffusion / FLUX для генерации изображений
- ML-эксперименты на 1-2 GPU
- CAD/3D с GPU-рендером
- Корпоративный AI-чат на небольшую команду
Конфигурация
Конфигурация на обзоре:
| Компонент | Что стоит |
|---|---|
| Корпус | Tower с mesh-перфорацией и свободной посадкой под 2 двухслотовых GPU |
| Материнская плата | ASUS ROG, LGA1700, 4 слота DDR5 |
| Процессор | Intel Core i5-13600KF, 14 ядер (6P+8E), 24 МБ L3, 3.5 ГГц |
| Память | 64 ГБ DDR5-6400 (2× 32 ГБ), потолок до 192 ГБ |
| GPU | 2× NVIDIA RTX 4090, 24 ГБ GDDR6X каждая (48 ГБ суммарно) |
| Накопитель | 1× SSD 2 ТБ SATA |
| Блок питания | 2200 Вт |
Тест: DeepSeek R1 70B на двух GPU
Запустили DeepSeek R1 70B через Ollama в Docker. Модель на 45 ГБ с контекстом 8192 токена.
Ollama разрезает её пополам и грузит по 22-23 ГБ на каждую карту - модель работает полностью в видеопамяти, без выгрузки в системную RAM. Загрузка GPU - 48-50% на обеих параллельно. Вентиляторы корпуса справляются без воя.
Перед отгрузкой собранную машину гоняем под полной нагрузкой - стабильность БП, температуры, монтаж карт. К заказчику она уезжает уже после прогона под пиковыми режимами.
Эта сборка с 2× RTX 5090 - в каталоге ITTELO. Актуальная конфигурация, цена и условия - на странице товара.
Нужна другая конфигурация? У нас есть и десктопные tower-сборки, и серверные платформы на 4-8 GPU с резервированием БП и RAID. Расскажите про задачу - подберём железо и посчитаем питание под нужное количество карт.


