- ML-платформа построена на сервисе Managed Kubernetes от Selectel.
- Она разворачивается в клиентском аккаунте и полностью доступна для дополнительных настроек и модификаций.
- Базовое доменное имя для доступа на главную страницу ML-платформы регистрируется в служебном аккаунте Selectel, пользователь не может сменить имя самостоятельно.
- Мы предварительно согласуем с вами конфигурацию каждой инсталляции платформы. Конечная настройка осуществляется в рамках согласованной конфигурации.
- ML-платформа адаптирована под установку системы управления ML-экспериментами ClearML и поддерживает использование ClearML-агентов как на серверах в клиентском контуре, так и на дополнительных мощностях Selectel.
- Если для экспериментов вам нужно обрабатывать персональные данные, то вы можете использовать сертифицированные сервисы Selectel .
Как устроена ML-платформа
Детали о работе платформы
Для каких задач подходит сервис
Упростить тестирование ML-моделей
Вы сможете генерировать API для ML-моделей, мониторить запросы, настроить конвейер операций обработки запросов (inference graph). Все это почти без написания кода.
Получить ресурсы для обучения ML-моделей
С нашей платформой вы получите гибкую систему тарификации GPU, возможность арендовать выделенные или облачные серверы, а также кластеры Kubernetes. Мы гарантируем высокий SLA.
Ускорить релиз новых версий модели
ML-платформа помогает автоматизировать выполнение pipelines, кэшировать датасеты и environments для экспериментов. Это позволяет быстрее выбирать лучшую модель по результатам множества экспериментов.
Изучить концепцию MLOps
До начала работы мы покажем, как пользоваться платформой, и будем помогать в процессе ее использования. Новые сотрудники смогут разбираться с технологиями без риска повредить реальную инфраструктуру ML-сервисов.
Стандартизировать рабочие процессы
У вашей ML-команды появится единый инструмент управления экспериментами, единая инфраструктура, а также точка входа в платформу и хранилище артефактов. Все это поможет команде унифицировать процесс работы и создать единые принципы взаимодействия.
Сократить траты на GPU-ресурсы
Мы поможем повысить утилизацию вычислительных ресурсов за счет разделения одной GPU между разными задачами, а также за счет подбора конфигураций и инструментов скейлинга вычислительных ресурсов.
ML-компоненты решения
ClearML
Платформа для проведения и трекинга ML-экспериментов, позволяющая:
- проводить изолированные ML-эксперименты в контейнерах Kubernetes,
- отслеживать и сравнивать гиперпараметры и метрики ML-экспериментов,
- создавать воспроизводимые ML-pipelines,
- организовать комплексную вычислительную инфраструктуру между облачными и выделенными серверами Selectel.
Kubeflow
Платформа для ML, позволяющая организовать полный цикл обучения и использования ML-модели в кластере Kubernetes. Набор инструментов Kubeflow позволяет:
- запускать Jupyter-среды для проведения экспериментов,
- создавать воспроизводимые ML-pipelines,
- развертывать модели в виде отдельных сервисов,
- мониторить работу моделей,
- разграничивать права доступа членов команды к артефактам работ
Хранение кода
Gitea
Gitea позволяет хранить код экспериментов в контуре ML-платформы и версионировать его по стандартным практикам. Также вы можете преднастроить ClearML для запуска экспериментов напрямую из репозиториев Gitea. Чтобы это сделать, необходимо настроить зеркалирование клиентских репозиториев в Gitea. Это позволит не загружать код экспериментов в два отдельных репозитория.
Инфраструктурные сервисы
Homepage
Grafana, Prometheus, Alert manager
Объектное хранилище с поддержкой S3
CRaaS
Кластеры Kubernetes
Безопасность
Keycloak
Единая система авторизации пользователей (SSO) для входа во внутренние сервисы ML-платформы. Помогает разграничивать доступы пользователей и поддерживает безопасность на высоком уровне.
Сертификаты и DNS
Частная инсталляция ML-платформы включает в себя сгенерированные доменные имена для всех публичных сервисов, сертификаты для них, а также необходимую настройку балансировщиков нагрузки и Ingress-контроллеров.
Соответствие 152-ФЗ
Выделенные серверы, облачная платформа Selectel и Managed Kubernetes имеют акт оценки эффективности, который гарантирует, что они соответствуют требованиям 152-ФЗ до первого уровня защищенности.
Безопасность систем
Предоставляем IT-инфраструктуру для проектов с повышенными требованиями безопасности, а также сервисы для защиты сетей, ОС и приложений.
Поддержка
Дадим возможность бесплатного тестирования на две недели
Проконсультируем вашего администратора
Будем отвечать на вопросы 24/7
Узнайте больше о работе ML-платформы
Истории успеха
Как RobotMIA удалось запустить более 400 голосовых роботов в облаке
В компании хотели создать комфортные условия для пользователей при общении с голосовыми роботами, а также научить тех предоставлять максимально релевантные ответы. Все это удалось благодаря размещению сервисов на инфраструктуре Selectel.
1–2 секунды
среднее время ответа голосового робота
4
региона ЦОД поддерживают инфраструктуру клиента
Про ML-платформу
Что такое ML-платформа?
ML-платформа Selectel — это инфраструктура, которая подготовлена для ML-разработки, например для обучения и развертывания ML-моделей.
При подборе компонентов ML-платформы используются ресурсы облачной платформы. После подключения платформы ее состав можно расширить собственными программными компонентами. Подробнее об ML-платформе и ее компонентах читайте в разделе ML-платформа в документации.
Как протестировать ML-платформу?
Создайте заявку на тест ML-платформы в панели управления — мы свяжемся с вами для уточнения деталей. Подробнее о создании заявки читайте в подразделе Подключить платформу инструкции Общая информация о продукте ML-платформа в документации.
На отдельной встрече обсудим требуемую конфигурацию кластера и его дополнительные настройки на период теста. Мы предоставляем бесплатный двухнедельный тестовый период. Это поможет вам изучить актуальную версию ML-платформы. В рамках тестирования вы сможете выбрать интересующие модели GPU и провести несколько экспериментов. На это время мы создадим чат в мессенджере для срочных вопросов по работе платформы.
После завершения теста устроим встречу, чтобы обсудить результаты. Если результаты теста положительные, то мы совместно запланируем дальнейшие действия по развертыванию клиентской инсталляции ML-платформы.
Можно ли получить консультацию по настройке ML-платформы под свои задачи?
Да, мы можем проконсультировать по данному вопросу. Напишите нам на почту sales@selectel.ru или позвоните по телефону 8 800 555 06 75.
Можно ли развернуть ML-платформу on-premise?
Нет, такая возможность отсутствует.
Про технические возможности и конфигурации
В каких пулах доступны кластеры с GPU?
Наибольшее количество кластеров с GPU собрано в пуле ru-7, который находится в наших дата-центрах в Москве. Вы можете создать кластер и в других пулах, но в них меньший выбор моделей. Подробнее о доступных кластерах с GPU в подразделе GPU для облачных серверов и Managed Kubernetes инструкции Матрицы доступности в документации.
Можно ли изменять конфигурацию кластера самостоятельно?
Да, вы можете добавлять и удалять ноды кластера по API, Terraform или через панель управления. Подробнее в разделе Работа с группами нод Managed Kubernetes в документации.
Можно ли отключать ноды кластера, чтобы не платить за них, пока они не используются?
Вы можете уменшить количество нод в группе или удалить группу нод в кластере. Также вы можете удалить все ноды из группы и оставить пустую группу нод. В пустой группе нод сохраняются конфигурации нод, метки, тейнты и user data, но оплата за ноды не начисляется. Подробнее в разделе Работа с группами нод Managed Kubernetes в документации.
Как подключить собственную инфраструктуру к ML-платформе?
ML-платформа — сервис, который работает на базе кластеров Managed Kubernetes, поэтому вам нужно настроить сетевую связность между собственной инфраструктурой и кластером.
Если у вас возникнут вопросы или сложности, создайте тикет.
Какой объем кэша можно добавить в ML-платформу?
Вы можете подключить к платформе кэш размером до 10 ТБ.
Про совместимость с внешними системами
Можно ли использовать стороннее объектное хранилище для датасетов?
Да, вы можете подключить к платформе любое хранилище S3. Подробнее в инструкции Работа с датасетами в ClearML в документации.
Можно ли использовать собственный ClearML?
Да, вы можете использовать собственный ClearML. Мы поможем настроить ClearML-агенты на наших нодах.
Можно ли подключить свой домен для доступа к ML-платформе?
Да, можно. Вам нужно будет делегировать свой домен в наш DNS. Подробнее в инструкции DNS-хостинг: быстрый старт в документации.
Про стоимость
Как рассчитывается стоимость ML-платформы?
У нас есть установочный платеж в размере 4 999 рублей. Ежемесячная стоимость самой платформы формируется только из стоимости компонентов платформы: кластера Managed Kubernetes, S3, Container Registry. Мы рассчитаем точную стоимость после обработки заявки и подбора конфигурации.
Общая информация
Быстрый старт
Работа с платформой
Как мы запустили GPU NVIDIA H200 в Selectel, или почему в золотую лихорадку непросто продавать лопаты
GPU в облаке: повышаем производительность и сокращаем стоимость инфраструктуры
Решайте ML-задачи с помощью других сервисов Selectel
Обучать ML-модели и исследовать данные
Хранить данные
Производить ресурсоемкие вычисления
Выделенные серверы с GPU
Суперкомпьютер для HPC
Соответствовать требованиям 152-ФЗ, GDPR, AICPA SOC 2®
Развернуть собственную платформу для ML
Что дальше?
Регистрация в панели управления
Чтобы заказать услугу, зарегистрируйтесь в панели управления Selectel и пополните баланс удобным способом.
Создать аккаунтКонсультация перед заказом
По телефону 8 800 555-06-75 или по почте sales@selectel.ru— изучим задачу и подберем лучшее решение под ваш бюджет и требования.





