Системное администрирование

Senior MLOps инженер

Мы ищем Senior MLOps-инженера в команду Machine Learning Infrastructure Services!

Ты будешь участвовать в проектировании и развитии Inference Platform-as-a-Service — масштабируемой, отказоустойчивой и производительной платформы для сервинга ML-моделей.

Мы ищем специалиста с опытом и отраслевой экспертизой, готового принимать инженерные решения и развивать наши продукты!

  • Санкт-Петербург / Удаленно
  • Гибкий
Основные задачи
  • Разрабатывать и поддерживать Inference Platform-as-a-Service
  • Автоматизировать жизненный цикла ML-моделей - от регистрации до сервинга модели
  • Создавать новые продукты для автоматизации ML-разработки
  • Разрабатывать платформенные сервисы для ML
  • Исследовать новые платформы/инструменты для внедрения их в продукты компании
  • Продвигать и развивать best practices в области MLOps
Мы ожидаем
ML / Inference трек
  • Опыт развертывания и эксплуатации Kubernetes для инференса моделей (GPU/CPU)
  • Практический опыт работы с MLOps-инструментами деплоя и эксплуатации моделей (Triton Inference Server, BentoML или аналогов)
  • Опыт работы с инференс-движками в Kubernetes
  • Знание принципов автоскейлинга, балансировки нагрузки и маршрутизации трафика в контексте ML-сервисов
  • Понимание принципов мониторинга качества и параметров ML-моделей
  • Опыт настройки и использования GPU-инфраструктуры: драйверы, CUDA Toolkit, MIG, GPU-Enabled Docker (nvidia-container-toolkit)
  • Понимание жизненного цикла ML-экспериментов и их трекинга (MLflow/Clearml или аналоги)
  • Уверенное знание Python
OPS трек
  • Экспертные знания Kubernetes: контроллеры, операторы, HPA, работа с GPU (allocation, driver’s)
  • Опыт автоматизации инфраструктуры и Infrastructure as Code (Terraform, GitOps-подходы)
  • Опыт работы с системами контроля версий и CI/CD (GitLab, GitHub)
  • Опыт работы с Docker и OCI-образами
  • Администрирование Linux: от настройки до мониторинга и диагностики проблем
  • Опыт внедрения и работы со стеком мониторинга (Prometheus Stack)
  • Навыки безопасной работы с чувствительными данными (секреты, токены, сертификаты)
Будет плюсом
  • Опыт работы с Jupyter-средами
  • Знание REST/gRPC, HTTP-трассировки и дебага инференс-эндпоинтов
  • Опыт разработки проектов по работе с данными и ML на Python
  • Знание фреймворков ML/DL: PyTorch, TensorFlow, HuggingFace Transformers
  • Знание оркестраторов задач (Prefect, AirFlow)
  • Понимание принципов тестирования (Unit, Integration, System)
  • Понимание основ машинного обучения, его методов, а также сопряженных с ним дисциплин
  • Опыт поддержки production AI-сервисов
  • Желание помогать клиентам в решении их задач
Про условия
  • Оформление в официально аккредитованную IT-компанию
  • Белая заработная плата
  • Годовая премия по результатам работы до 15% от суммарного оклада за 12 месяцев
  • 30 000 бонусных рублей на услуги компании ежегодно
  • Релокационный бонус при переезде
  • Бесплатные обеды и кофе-брейки
  • Гибкое начало рабочего дня (до 12:00), гибридный формат работы
Про здоровье и спорт
  • Ежемесячная надбавка за некурение
  • ДМС + стоматология + офисный врач* (с первого дня работы)
  • Компенсация психологических консультаций: онлайн или в кабинете психолога
  • 50% оплата абонемента в фитнес-клуб и спортивный зал в офисе*
  • Внутренние спортивные турниры, корпоративные тренировки и участие в спортивных мероприятиях (забеги, велозаезды, заплывы, «Гонка героев», кибертурниры)
  • Офисный душ*
Про досуг
  • Образовательные мероприятия (мастер-классы, лекции, квизы, экскурсии)
  • Тематические киновечера и регулярные вечера настолок (обожаем DnD и спортивную мафию!)
  • PlayStation zone*, кикер и настольный теннис
  • Несколько крупных тусовок в году, а также зимой ездим гонять на сноубордах и лыжах, а осенью в пейнтбол
Про развитие
  • От 50% до 100% оплаты обучения английскому и еженедельные бесплатные разговорные клубы с носителями
  • Внутренние обмены знаниями: lightning & thunder talks, Selectel MasterClass
  • Внутренняя база знаний и курсов
  • Рекомендации по обучению и развитию
  • Персонализированный подход к обучению, возможность участия в конференциях по всему миру
  • Онлайн-библиотека Alpina Digital

*пока что только для питерского офиса

Откликнуться на вакансию