Система хранения данных (СХД) - что это, какими они бывают и чем отличаются

Что такое система хранения данных

В статье рассмотрим различные типы систем хранения данных, их особенности, преимущества и недостатки, а также ключевые факторы, которые следует учитывать при их выборе.

Изображение записи

Для чего нужны системы хранения данных

Система хранения данных (СХД) — специализированная инфраструктура для централизованного хранения и управления информацией в компьютерных сетях.

СХД позволяет получить доступ к хранящимся данным из разных узлов сети, обеспечивает высокую скорость передачи информации и легко масштабируется. Она широко используются в корпоративных сетях и центрах обработки данных для обеспечения надежного и эффективного хранения информации.

Как устроена система хранения данных

С точки зрения аппаратного устройства системы хранения данных имеют сложную структуру, включающую различные компоненты.

  • Массив жестких дисков (HDD или SSD). Представляет собой группу физических дисков, которые используются для хранения данных. HDD используются для долгосрочного хранения информации, а SSD обеспечивают более высокую скорость чтения и записи.
  • Кэш-память (или кэш-накопитель). Здесь временно хранятся наиболее часто используемые данные, к которым можно получить быстрый доступ.
  • Контроллер дискового массива (RAID-контроллер). Управляет работой массива жестких дисков. Он обеспечивает объединение нескольких дисков в логические группы, резервирование данных, контроль целостности данных и управление доступом к данным.
  • Внешний корпус. Представляет собой физическую оболочку, в которой размещаются компоненты СХД, включая массив жестких дисков, кэш-память и контроллер дискового массива. Обеспечивает физическую защиту и организацию компонентов СХД.
  • Блоки питания. Обеспечивают электропитание для всех компонентов СХД и гарантируют их непрерывную работу.

Каждый из этих компонентов выполняет важные функции в СХД, обеспечивая сохранность и доступность данных. Они могут быть настроены и адаптированы в соответствии с требованиями организации и конкретным сценарием использования.

Классификация СХД

Системы хранения данных можно классифицировать на несколько типов в зависимости от различных критериев.

По типу организации доступа

СХД можно конфигурировать множеством разных способов и благодаря этому — создать наиболее подходящее сочетание ПО, аппаратных компонентов и протоколов.

Direct Attached Storage (DAS)

Это хранилище представляет собой набор жестких дисков, который подключается к компьютеру или серверу без использования сети через USB, Thunderbolt, eSATA или SCSI. За счет этого DAS обеспечивает более высокую скорость передачи данных, чем, например сетевые хранилища вроде Network Attached Storage (NAS) или Storage Area Network (SAN).

Network Attached Storage (NAS)

Устройство предоставляет централизованное хранилище для файлов и данных, доступное для всех устройств в сети. NAS управляется специальным программным обеспечением, которое обеспечивает доступ к информации через протоколы сетевой передачи данных, такие как FTP, SMB, NFS и другие. 

Пользователи могут создавать различные каталоги и разделять доступ к ним с помощью учетных записей и прав доступа. Некоторые устройства NAS предлагают дополнительные функции: резервное копирование, потоковое воспроизведение мультимедиа, доступ к файлам через интернет и т. д. Среди других преимуществ NAS — удобство централизованного хранения данных, возможность резервного копирования, легкость расширения хранилища и доступ к файлам из любой точки сети.

Storage Area Network (SAN)

Это специализированная высокоскоростная сеть, обеспечивающая сетевой доступ к устройствам хранения данных. Она обычно состоит из хостов, коммутаторов, элементов и устройств хранения, которые соединены между собой. SAN представляет устройства хранения данных хосту таким образом, что они кажутся локально подключенными. Такое упрощенное представление хранилища хосту достигается за счет использования виртуализации ресурсов.

По типу работы с данными

Большинство сервисов по хранению данных основаны на архитектуре СХД. Информация в них может храниться по-разному: в виде отдельных файлов, блоков или объектов. Это зависит от типа данных, а также определяет способ доступа к ним.

Файловые хранилища

Файловые хранилища используются для хранения и управления файлами и папками. Они предоставляют доступ к данным через протоколы NFS (Network File System) для UNIX/Linux-систем и CIFS (Common Internet File System) для систем Windows. Файловые системы, например NAS, обеспечивают общий доступ к данным и удобство в работе с файлами.

Блочные хранилища

Блочные хранилища работают на более низком уровне и предоставляют доступ к данным в виде блоков фиксированного размера. Они используются для хранения и передачи данных в виде блоков, например по протоколам Fibre Channel, iSCSI или SCSI. Блочные устройства обычно используются для хранения информации, требующей высокой производительности и низкой задержки, такой как базы данных, и виртуализации.

Объектные хранилища

Объектные хранилища организуют данные в виде объектов, которые содержат сами данные, метаданные и уникальный идентификатор. Это позволяет эффективно управлять большими объемами информации, такими как big data, а также обеспечивает гибкость и масштабируемость хранения. Объектные хранилища часто используются для хранения данных в облаке и для распределенных систем.

В СХД могут использоваться различные комбинации этих типов хранения данных в зависимости от требований и конфигурации системы.

Отказоустойчивость СХД и восстановление после сбоев

В какой бы системе ни хранились данные, провайдер обязан следить за отказоустойчивостью инфраструктуры. Резервное копирование, репликация, распределение нагрузки, защита от атак и другие услуги помогают сделать СХД более устойчивой. А если сбой все же произойдет — минимизировать его последствия и максимально быстро восстановить систему.

Для оценки способности СХД восстанавливаться после сбоев используются два показателя: RPO и RTO.

  • RPO (Recovery Point Objective). Определяет максимально допустимую потерю данных в случае сбоя. Этот показатель указывает, насколько близко к моменту сбоя должны быть восстановлены данные. Чем меньше RPO, тем меньше потеря данных при восстановлении.
  • RTO (Recovery Time Objective). Определяет максимально допустимое время восстановления после сбоя. Этот показатель указывает, сколько времени требуется для восстановления работы системы после сбоя. Чем меньше RTO, тем быстрее система восстанавливается и снова становится доступной.

Как выбрать СХД

При выборе СХД следует учесть несколько важных факторов.

  • Емкость хранения. Определите требуемую емкость для ваших данных в настоящем и в будущем. Учтите рост объема данных со временем.
  • Производительность. Оцените требования к производительности вашего приложения или рабочей нагрузке. Учитывайте важные параметры, такие как скорость чтения и записи, задержка (лаг) и скорость передачи данных.
  • Надежность. проверьте, имеет ли СХД функции резервного копирования, отказоустойчивости и восстановления. 
  • Масштабируемость. Учитывайте, как легко можно масштабировать СХД в будущем. Убедитесь, что устройство поддерживает возможность добавления дополнительных дисков или расширение хранилища без значительных проблем.
  • Совместимость. Удостоверьтесь, что СХД совместима с вашей существующей инфраструктурой, такой как операционные системы, виртуализация или сетевые протоколы.
  • Бюджет. Определите свой бюджет и просмотрите предложения разных производителей. Сравните стоимость, функциональность и поддержку, чтобы выбрать наиболее подходящий вариант.

Важно также обратиться к специалистам или консультантам, чтобы получить дополнительную информацию о конкретных моделях СХД и их соответствии вашим требованиям.

Пользователям дата-центров доступны как выделенные СХД целиком, так и логические юниты LUN от 1 ТБ в shared-устройствах. Выделенные СХД обычно используются крупным бизнесом с большими объемами данных, тогда как LUN идеально подойдет для работы с базами данных, виртуализацией или медиафайлами.

Заключение

В будущем, с ростом объемов и требований к анализу данных, СХД будут продолжать развиваться и достигать все более высоких показателей производительности и надежности. Так, только в декабре 2023 года вышло более десяти моделей новых систем хранения данных. Среди них Dell ObjectScale X Series, Аквариус Wareus, Huawei OceanStor Dorado 2100, Seagate Exos Corvault 4U106, iXsystems TrueNAS F-Series, Scality Artesca и другие.

Мы в Selectel следим за новинками в мире железа и используем актуальные решения. Так,  в качестве своей All-flash СХД мы используем Huawei OceanStor Dorado с накопителями NVMe-специализированного форм-фактора. Она поддерживает RAID 2.0 и максимально задействует механизмы, позволяющие сберечь ресурс SSD, предотвратив «амплификацию» записи. Более того, RAID 2.0 позволяет делать full stripe write, что тоже влияет на скорость и износ.