Годовой дайджест по аналитике и ML за 2023

Станислав Валуев Руководитель отдела Data/ML-продуктов 31 января 2024

В статье — ежемесячные дайджесты, экспертные статьи по ML и дата-аналитике, а также записи докладов с наших мероприятий.

Привет! Я Стас, занимаюсь развитием аналитических и ML-продуктов в Selectel. В новом мега-дайджесте мы с командой собрали для вас свои лучшие материалы по итогам 2023 года. Читайте и сохраняйте в закладки: пригодится тем, кто хочет быть в курсе новостей и актуальных технологий из мира AI, ML и дата-аналитики.

Подробнее о ML-платформе

Дайджесты

Формат дайджестов нельзя назвать чем-то новым для нас: мы с коллегой Антоном Чунаевым начали регулярно публиковать материалы по Data-аналитике и ML еще в 2021 году, на самой заре существования Telegram-сообщества «MLечный путь». С тех пор общее количество дайджестов перевалило за 200 и продолжает расти.

В 2023 году, собрав обратную связь от читателей, мы добавили новый формат — «дайджест дайджестов». В нем мы рассказываем о самых значимых и обсуждаемых статьях за прошедшие месяцы.

Всего мы выпустили юбилейные десять дайджестов:

Месяц	Дайджест
Март	Сколько будет стоить ChatGPT для Google? Дайджест полезных текстов про ML и дата-аналитику
Апрель	Массивный курс по управлению данными и обзор новинок от NVIDIA
Май	Новые инструменты для работы c ML-моделями и обзор MLOps от CERN
Июнь	CI/CD в Data Science, MLOps в финтехе и тенденции в потоковой передаче данных
Июль	Ликбез по LLM, новинки от Nvidia и видеокейс по внедрению MLOps
Август	MLOps от Gucci и оценка уровня Data Driven’ности в компании
Сентябрь	Python в Excel, базы данных без SQL и трудности в аналитике
Октябрь	MLOps-инструменты, обзоры рынка и тренды потоковой обработки данных
Ноябрь	Новые чипы от Microsoft, Git для аналитиков и эволюция Data Platform
Декабрь	«Возрождение» больших данных, оптимизация инференса LLM и новинки от AMD

От редакции хочу выразить благодарность всем, кто читает, комментирует и добавляет в закладки. Реакция аудитории сподвигает нас продолжать эту работу, так как основная ее цель — развитие русскоязычного сообщества Data- и ML-специалистов.

Инфраструктура для ML(Ops)

Мы, как провайдер IT-инфраструктуры, также занимаемся адаптацией наших инфраструктурных и платформенных сервисов для решения ML-специфичных задач под современные запросы. Постоянно исследуем и учимся чему-то новому.

Если бы нужно было выбрать название какой-то технологии в качестве слова года, то победу одержал бы Kubernetes. Именно прикладная работа с ним стала самой частой темой статей, которые писали наши инженеры. Что же они сделали?

Научились делить видеокарты

Представьте: есть у вас команда из десятка Data Science-специалистов, каждому нужна видеокарта для работы. И вроде нет ничего сложного: взял GTX 1050 Ti — и в бой. Однако это устроено немного не так.

Для вычислений, например, больших ML-моделей или предиктивной аналитики на массивных датасетах нужны производительные видеокарты. И если доступных ресурсов окажется недостаточно, образуется очередь: какие-то специалисты будут отдыхать на кофепоинтах, пока другие работают.

DevOps-инженер Антон подготовил серию статей, в которой разобрал различные способы экономии ресурсов за счет разделения (шеринга) и совместного использования GPU — с помощью технологий MIG, TimeSlicing и MPS:

Эти статьи — нечто большее, чем простые тексты. В них мы поделились результатами собственных исследований и экспериментов, а также технологиями, которые запускаем в прод для наших клиентов.

Ускорили проведение экспериментов

Часто проведение ML-экспериментов сводится к долгому поиску и загрузке нужных датасетов и моделей, скрупулезной настройке гиперпараметров с целью проверки гипотез. Но что делать, когда времени мало, а за ночь нужно зафайнтюнить «ламу»?

*ML-эксперимент на примере языковой модели LLama 2.*

MLOps-инженер Ефим потратил ночь (и даже не одну) и разобрал особенности кэширования датасетов и рабочих окружений для ускорения работы с экспериментами:

Как «воспитать ламу» и ускорить ML-эксперименты

Кстати, статья написана по мотивам доклада на Selectel Tech Day. Если вы аудиал — welcome на YouTube.

Забэкапили кластеры

Разработчикам и системным администраторам важно обеспечивать надежность и доступность данных в приложениях Kubernetes. Несмотря на высокую степень автоматизации и управления контейнерами, всегда остаются риски сбоев или человеческих ошибок — поэтому необходимо заранее задуматься о резервном копировании.

Системный администратор Филипп изучил этот вопрос подробнее и описал несколько способов резервного копирования значимой информации в Kubernetes:

Правильные, но (не)простые бэкапы. Как настроить резервное копирование в Kubernetes?

Если любите большие и сложные технические материалы, то статья для вас.

Наш исследовательский опыт вложен не только в статьи. В сентябре вышла из беты ML-платформа Selectel — облачное решение с преднастроенными аппаратными и программными компонентами для обучения и развертывания ML-моделей.

Мы разворачиваем платформу индивидуально для каждого клиента и можем реализовать все фичи, о которых пишем. А также добавить в сборку такие open source-инструменты, как ClearML или Kubeflow — в общем, все для того, чтобы вы смогли организовать полный цикл обучения и тестирования ML-моделей.

Профессиональное развитие и практика

Вклад в ML-сообщество — это не только про обзор новых технологий и исследований, но и идеологический взгляд на наше ремесло. В прошлом году мы выпустили не одну статью, в которых постарались собрать «портрет» современного специалиста.

Ефим поделился своим видением необходимого и достаточного пути развития для разностороннего ML-специалиста. Более того, собрал подборки материалов, которые помогут этот путь «найти»:

А для тех, кто только начинает погружаться в MLOps или инфраструктурные решения для ML, мы написали несколько статей с практическими примерами работы с генеративными сетями:

Конференции и доклады

Статьи читают не все: часть нашей аудитории предпочитает посещать конференции и слушать доклады. Поэтому в 2023 не обошлось и без публичных выступлений и прочего амбассадорства.

MLечный путь

Провели ежегодную конференцию MLечный путь, на которой вместе с коллегами из Русагро, Neoflex, Контур AI рассказали про:

А также провели дискуссию на тему «Потребности ML-рынка России». Записи с прошлых конференций можно найти в плейлисте.

Selectel Tech Day 2023

Кроме того, мы провели первую секцию, посвященную ML/AI, в рамках конференции Selectel Tech Day 2023:

ML Podcast

А еще сходили в гости в ML Podcast и поделились своим мнением о том, что такое MLOps. Кстати, если не читали без преувеличения «монструозную» статью Антона — рекомендую ознакомиться.

Кроме того, наши инженеры отлично съездили на конференцию Smart Data и Conversations AI, а также выступили приглашенными экспертами на Highload++. Если будете на отраслевых конференциях в этом году и увидите нас, смело подходите — пообщаемся.

Машинное обучение и обработка данных