Новые процессоры в новом пуле облака Selectel
amarao

С некоторыми задержками, но мы запускаем новый пул на новых процессорах. Старые процессоры Xeon L5520, новые — Xeon E5-2630. Вот мнение Intel о том, как различаются процессоры: http://ark.intel.com/compare/64593,40201

Ключевые позиции:

  • Удвоение размера кеша;
  • Полуторакратный рост числа операций с системной шиной в секунду;
  • Поддержка дополнительных инструкций процессора AVX;
  • 68% рост скорости работы оперативной памяти.

Цена процессорного времени для новых процессоров остаётся той же. При большей производительности это означает, что при равной нагрузке в новом пуле задача будет сделана быстрее и за меньше количество машинного времени, то есть дешевле.

Вместе с этими изменениями происходят и крупные изменения в тулстеке облака:

  • Переход на более новую версию гипервизора (3.4 -> 4.1) (чейнжлог для 4.1, 4.0);
  • Поддержку storage motion (крупный шаг для поддержки живой миграции между пулами);
  • Мажорное обновление xapi (changelog).

… и ещё множество локальных улучшений. А под шумок ещё убрали из списка доступных шаблонов в этом пуле ubuntu 10.04 в силу… м… ээ… потери рыночной актуальности.

Скажем честно, 90% из этих изменений — задел на будущее. Некоторые из них:

  1. Storage Motion позволит переносить диски между хранилищами и пулами на ходу, без прерывания работы;
  2. Новый гипервизор (Xen 4.1) позволит принять pv_ops ядра (ванильные ядра linux) в продакт без каких-либо патчей (прощайте, -xen версии ядер);
  3. xapi окончательно избавился от детских болезней XenSever’а и значительно упрощает процесс балансировки виртуальных машин между хостами.

Почему такой долгий деплой?

XCP 1.6, на котором основан новый пул, вышел в декабре 2012. А бета-версия третьего пула была выкачена в конце апреля 2013.

Причин задержек несколько. Во-первых тесты. На тестах мы нашли несколько ошибочных сценариев в работе xapi (они не ошибочные с точки зрения XenServer’а, но совсем не интересны для работы в качестве облачного тулстека). Под это дело была написана система автоматического тестирования, которая выполняет множество операций над готовой копией пула с вариацией параметров. Самый длинный тест у нас занимает больше 5 часов, и выполняется на двух пулах по два хоста в каждом.

Во-вторых адаптация нашей части тулстека под изменения xapi. Они кажутся косметическими, но каждое из них нам стоило несколько человеко-часов работы (сначала найти, потом адаптироваться). Консоли отдаются через TCP, а не через PTS, ряд атрибутов был потерян во время миграции операций с доменами из xapi в xenopsd и нам пришлось искать пути вокруг). Xen в свою очередь принёс изменения в ABI (потребовалось пересобирать/переписывать всю нашу обвязку, занимающуюся учётом SLA).

Способность виртуальных машин хотя бы теоретически путешествовать между пулами потребовала серьёзных изменений в структуру базы данных (раньше у нас было простое и ясное отношение — «у каждой виртуальной машины есть uuid её пула», а теперь пул может меняться, да ещё несколько раз на дню). Отдельной проблемой был передел IP-адресов (свободных IPv адресов всё меньше и меньше).

Что еще почитать по теме

Ульяна Малышева 11 марта 2021

Кейс VCV: как победить HR-рутину

Сервис VCV, клиент Selectel, был создан для того, чтобы сделать найм сотрудников комфортнее, объективнее, быстрее. Как работает VCV, зачем сервису искусственный интеллект и в чем разница российского и…
Ульяна Малышева 11 марта 2021
Владимир Туров 1 сентября 2020

Дело совершенно секретного iPod

Это был обычный серый день в конце 2005 года. Я сидел на рабочем месте и писал код для следующей версии iPod. Вдруг без стука ворвался директор ПО для iPod, начальник моего начальника, и закрыл дверь.
Владимир Туров 1 сентября 2020

Новое в блоге

Ульяна Малышева 22 июля 2021

DCIM-платформа Racks: почему мы отказались от энтерпрайз-решения в пользу самописного приложения

Как вести учет и контроль оборудования, если у тебя более десятка серверных в трех географически разделенных дата-центрах? Как и многие крупные провайдеры, в России и за рубежом, Selectel начал реализ…
Ульяна Малышева 22 июля 2021
Ульяна Малышева 7 июля 2021

Продуктовый дайджест: новые процессоры AMD EPYC™ и управление базами данных через Terraform

Пополнение линейки процессоров AMD EPYC™, управление кластерами «Облачных баз данных» через Terraform-провайдер Selectel и подбор идеальной инфраструктуры под «Битрикс24» и «1С-Битрикс». Подробнее — о…
Ульяна Малышева 7 июля 2021
Эллада Нуралиева 22 июня 2021

Next-Generation Firewall от FortiGate: обзор функций и подключение сервиса

Для защиты инфраструктуры от угроз часто используют межсетевые экраны. Они могут быть как программными, так и аппаратными. Типичный межсетевой экран представляет собой фильтр сетевого трафика, который…
Эллада Нуралиева 22 июня 2021
Ульяна Малышева 18 июня 2021

Selectel развернул 100 виртуальных машин для олимпиады «Я — профессионал»

Завершился четвертый сезон олимпиады «Я — профессионал», на который зарегистрировались 576 012 студентов из 348 вузов России. Selectel стал одним из партнеров трека олимпиады «Робототехника», который …
Ульяна Малышева 18 июня 2021