Senior MLOps инженер
Мы ищем Senior MLOps-инженера в команду Machine Learning Infrastructure Services!
Ты будешь участвовать в проектировании и развитии Inference Platform-as-a-Service — масштабируемой, отказоустойчивой и производительной платформы для сервинга ML-моделей.
Мы ищем специалиста с опытом и отраслевой экспертизой, готового принимать инженерные решения и развивать наши продукты!
- Санкт-Петербург / Удаленно
- Гибкий
Основные задачи
- Разрабатывать и поддерживать Inference Platform-as-a-Service
- Автоматизировать жизненный цикла ML-моделей - от регистрации до сервинга модели
- Создавать новые продукты для автоматизации ML-разработки
- Разрабатывать платформенные сервисы для ML
- Исследовать новые платформы/инструменты для внедрения их в продукты компании
- Продвигать и развивать best practices в области MLOps
Мы ожидаем
ML / Inference трек
- Опыт развертывания и эксплуатации Kubernetes для инференса моделей (GPU/CPU)
- Практический опыт работы с MLOps-инструментами деплоя и эксплуатации моделей (Triton Inference Server, BentoML или аналогов)
- Опыт работы с инференс-движками в Kubernetes
- Знание принципов автоскейлинга, балансировки нагрузки и маршрутизации трафика в контексте ML-сервисов
- Понимание принципов мониторинга качества и параметров ML-моделей
- Опыт настройки и использования GPU-инфраструктуры: драйверы, CUDA Toolkit, MIG, GPU-Enabled Docker (nvidia-container-toolkit)
- Понимание жизненного цикла ML-экспериментов и их трекинга (MLflow/Clearml или аналоги)
- Уверенное знание Python
OPS трек
- Экспертные знания Kubernetes: контроллеры, операторы, HPA, работа с GPU (allocation, driver’s)
- Опыт автоматизации инфраструктуры и Infrastructure as Code (Terraform, GitOps-подходы)
- Опыт работы с системами контроля версий и CI/CD (GitLab, GitHub)
- Опыт работы с Docker и OCI-образами
- Администрирование Linux: от настройки до мониторинга и диагностики проблем
- Опыт внедрения и работы со стеком мониторинга (Prometheus Stack)
- Навыки безопасной работы с чувствительными данными (секреты, токены, сертификаты)
Будет плюсом
- Опыт работы с Jupyter-средами
- Знание REST/gRPC, HTTP-трассировки и дебага инференс-эндпоинтов
- Опыт разработки проектов по работе с данными и ML на Python
- Знание фреймворков ML/DL: PyTorch, TensorFlow, HuggingFace Transformers
- Знание оркестраторов задач (Prefect, AirFlow)
- Понимание принципов тестирования (Unit, Integration, System)
- Понимание основ машинного обучения, его методов, а также сопряженных с ним дисциплин
- Опыт поддержки production AI-сервисов
- Желание помогать клиентам в решении их задач
Про условия
- Оформление в официально аккредитованную IT-компанию
- Белая заработная плата
- Годовая премия по результатам работы до 15% от суммарного оклада за 12 месяцев
- 30 000 бонусных рублей на услуги компании ежегодно
- Релокационный бонус при переезде
- Бесплатные обеды и кофе-брейки
- Гибкое начало рабочего дня (до 12:00), гибридный формат работы
Про здоровье и спорт
- Ежемесячная надбавка за некурение
- ДМС + стоматология + офисный врач* (с первого дня работы)
- Компенсация психологических консультаций: онлайн или в кабинете психолога
- 50% оплата абонемента в фитнес-клуб и спортивный зал в офисе*
- Внутренние спортивные турниры, корпоративные тренировки и участие в спортивных мероприятиях (забеги, велозаезды, заплывы, «Гонка героев», кибертурниры)
- Офисный душ*
Про досуг
- Образовательные мероприятия (мастер-классы, лекции, квизы, экскурсии)
- Тематические киновечера и регулярные вечера настолок (обожаем DnD и спортивную мафию!)
- PlayStation zone*, кикер и настольный теннис
- Несколько крупных тусовок в году, а также зимой ездим гонять на сноубордах и лыжах, а осенью в пейнтбол
Про развитие
- От 50% до 100% оплаты обучения английскому и еженедельные бесплатные разговорные клубы с носителями
- Внутренние обмены знаниями: lightning & thunder talks, Selectel MasterClass
- Внутренняя база знаний и курсов
- Рекомендации по обучению и развитию
- Персонализированный подход к обучению, возможность участия в конференциях по всему миру
- Онлайн-библиотека Alpina Digital
*пока что только для питерского офиса