Inference-платформа

Получайте готовые API с собственными ML-моделями без разработки — в несколько команд и с автомасштабированием ресурсов. А мы поможем с настройкой платформы, обеспечим инфраструктуру и техподдержку.
  • Бесплатный альфа-тест
  • Масштабирование endpoint
  • Serving моделей
Протестируйте inference-платформу бесплатно
Даем две недели на тест — за это время вы сможете запустить несколько сервисов и оценить производительность.

Для каких задач подойдет сервис

Сократить time-to-market

Inference-платформа позволяет запускать AI-проекты до 3 раз быстрее.

Сделать ML-модель публичным сервисом

Платформа позволяет получить готовый endpoint с ML-моделью за несколько минут — достаточно загрузить файл с моделью в S3-контейнер и ввести несколько команд.

Бесперебойно обновить модель

Обновляйте версию работающей модели, не прекращая обработку пользовательских запросов.

Масштабировать модель

Endpoint автоматически масштабируется при увеличении нагрузки.

Как устроена inference-платформа

Платформа разворачивается на базе сервиса Managed Kubernetes от Selectel и основана на Open Source решениях для инференса:

  • NVIDIA Triton™ Inference Server;
  • Istio Ingress Controller.

Сервис в несколько команд подготовит ссылку на endpoint — достаточно загрузить файл обученной ML-модели в S3-бакет объектного хранилища Selectel и указать адрес бакета в манифесте запуска.

Преимущества аренды inference-платформы в Selectel

Гибкая настройка под профиль нагрузки

Мы поможем настроить платформу так, чтобы она решала ваши задачи эффективнее.

Высокая производительность

Выделенные под платформу GPU-ресурсы, а также встроенный в нее NVIDIA Triton™ Inference Server позволяют повысить пропускную способность инференса.

Отсутствие vendor lock-in

Это возможно за счет использования Open Source инструментов: NVIDIA Triton™ Inference Server и Istio Ingress Controller.

Круглосуточная техподдержка

Обращайтесь к нашим техническим специалистам 24/7, в выходные и праздники. Они ответят на вопросы, связанные с работой инфраструктуры. Подробнее — на странице о службе поддержки.

Экосистема из 40+ продуктов

Вы сможете разместить всю IT-инфраструктуру у одного провайдера. Например, развернуть кластеры Managed Kubernetes, подключить объектное хранилище и CDN, связать все через глобальный роутер.

Арендуйте продукты Selectel для решения задач, связанных с AI и ML

Managed Kubernetes с GPU
Обучайте модели, работайте с медиаданными, выводите ML-модели в продакшн. Кластеры с GPU более отказоустойчивы, так как в Kubernetes можно резервировать реплики приложения.
ML-платформа
Преднастроенная инфраструктура Selectel для обучения и развертывания ML-моделей на ClearML. Можно бесплатно тестировать две недели.
Data Analytics Virtual Machine
Облачный сервер с предустановленными набором инструментов: Jupyter Lab, Prefect, Apache Superset.
Вся инфраструктура — у одного провайдера
Соберите собственное решение — узнайте обо всех сервисах Selectel для машинного обучения и работы с ИИ.

Примите участие в бесплатном альфа-тесте инференс-платформы

Оставьте заявку, мы свяжемся с вами в течение рабочего дня, зададим вопросы про проект и сориентируем по срокам.

Вы всегда можете получить бесплатную консультацию по телефону 8 800 555 06 75, почте sales@selectel.ru или в  Telegram.