VRAM-калькулятор

Инструмент для расчёта необходимого объёма видеопамяти и подбора GPU для инференса ИИ-моделей на мощностях Selectel.

GPU под ваши задачиBeta
Зарегистрируйтесь в панели
Управляйте 50+ продуктами в одном интерфейсе

Регистрируясь, вы соглашаетесь на обработку персональных данных в соответствии с политикой

Есть аккаунт? Войти

Подберите оптимальный GPU для запуска LLM

Калькулятор показывает ориентировочные значения. Для точного подбора инфраструктуры под ваш запрос рекомендуем  — мы подробно рассмотрим вашу задачу и предложим оптимальное решение.

  • Параметры

    Модель

    Квантизация модели

    Квантизация KV cache

    Длина контекста

  • GPU
    Выберите модель и ее параметры, чтобы получить список подходящих GPU под ваши задачи
0 ГБ
Общий VRAM
0 %
Потребления от GPU
Перейти в панель
Параметры модели
Вес модели
0 ГБ
KV Cache
0 ГБ
Активации
0 ГБ
Оверхед
0 ГБ
0 %
Потребления от GPU

Все для AI в одной панели управления

Выделенные серверы

Используйте для инференса, файн-тюнинга и обучения языковых моделей. Есть серверы в наличии: NVIDIA HGX B300, H200, RTX 6000 PRO L, RTX 4090 и другие.

Облачные серверы

Надежные виртуальные машины для сервисов в облаке, которые общаются с ассистентами — с автоматическим масштабированием, оплатой по потреблению и готовностью за минуты.

Foundation Models Catalog (FMC)

Сервис для запуска и управления LLM в облаке Selectel. Выберите модель, конфигурацию и получите готовый endpoint для работы с ней.
Цена всех услуг указана с учетом НДС 22%

Возможности для быстрого старта

− 44% скидка в облаке

− 29% на NVIDIA A100 (40 ГБ) и −44% на NVIDIA A30. Они подойдут для обучения нейросетей, решения сложных AI-вычислений, ускорения рабочих нагрузок и инференса.

Серверы с GPU навынос

Аренда серверов с бесплатной доставкой на вашу площадку или в любые сторонние дата-центры по РФ и не только. А после 3 лет аренды доступна опция выкупа за 1 месячный платеж.

Бесплатно перенесем ваш проект в Selectel

Проведем аудит, подберем инфраструктуру, все перенесем и проследим за работой сервисов

FAQ

  • Какие факторы формируют серверный расчет VRAM?
  • Как размер батча (Batch Size) влияет на требования к памяти?
  • Какие типы квантования оптимальны для инференса?
  • Что происходит при превышении лимита VRAM в продакшене?
  • Как рассчитать VRAM для MoE (Mixtral, DeepSeek) архитектур?
  • Как выбрать оптимальный GPU под расчетные данные?

Готовы начать?

Зарегистрируйтесь в панели управления, чтобы получить доступ ко всем продуктам Selectel и управлять инфраструктурой в едином окне

Регистрируясь, вы соглашаетесь на обработку персональных данных в соответствии с политикой

Есть аккаунт? Войти