Версионирование объектов в S3: работа с версиями Python

Версионирование объектов в S3: пример работы с версиями Python

Александр Гришин
Александр Гришин Продакт-менеджер
5 мая 2025

В этой статье разберемся, как включить версионирование в объектном хранилище Selectel и работать с ним через Python с использованием библиотеки boto3 и панель управления. Материал пригодится как инженерам облачной инфраструктуры, так и разработчикам приложений.

Изображение записи

Версионирование объектов в S3-хранилищах — это мощный механизм, который позволяет отслеживать изменения файлов, предотвращать их случайное удаление и восстанавливать предыдущие версии. Это особенно полезно при работе с резервными копиями или чувствительными данными — есть возможность в любой момент вернуться к определенному состоянию объекта или восстановить его даже после удаления.

Часть работы в панели управления Selectel

В целом, здесь нам нужно просто создать и настроить контейнер объектного хранилища. Очень подробный пошаговый гайд вы найдете в статье моего коллеги. Я же перечислю только основные шаги.

  1. Перейдите в панель управленияОбъектное хранилище и нажмите Создать контейнер.
  2. Выберите тип адресации vHosted. Что касается типа контейнера, то для работы с чувствительными данными подойдет приватный, а если планируете реализовать доступ к контенту без авторизации, выберите публичный.
  3. Включите версионирование на этот контейнер.
  4. Создайте служебного пользователя с ролью «Администратор объектного хранилища» и доступом в нужный проект.
  5. Создайте S3-ключ в панели управления.
  6. Сохраните Access Key и Secret Key. Будьте внимательны: ключи не хранятся в наших системах и показываются только один раз.
Скриншот из панели управления.
Работа с сервисными пользователями в панели управления.

Включаем версионирование в бакете

Перед тем, как работать с версиями файлов, необходимо включить версионирование в контейнере. Это переопределяет поведение хранилища.

  • При выключенном версионировании объекты с одним и тем же именем будут перезаписаны при повторной записи.
  • При включенном версионировании вместо перезаписи каждая новая версия объекта будет храниться отдельно. Это позволяет возвращаться к нужному состоянию объекта.

Включение через графический интерфейс

Версионирование можно включить при создании контейнера. Для этого поставьте галочку Версионирование в разделе Защита данных.

Скриншот из панели управления.
Включение версионирования при создании нового контейнера.

Эту функциональность можно включать и выключать также и для существующего контейнера. Стоит учесть, что выключение версионирования не удаляет существующие версии в контейнере версии объектов, а лишь меняет поведение хранилища при записи. Новые версии перестанут записываться отдельным объектом, а будут перезаписывать существующий.

Скриншот из панели управления.
Включение версионирования для уже существующих контейнеров.

Включение через API (Python + boto3)

Если же вам удобнее работать с кодом, то берем библиотеку boto3 и включаем версионирование с помощью нескольких строк:


    import boto3

s3 = boto3.client(
    's3',
    endpoint_url='https://s3.storage.selcloud.ru',
    aws_access_key_id='ВАШ_ACCESS_KEY',
    aws_secret_access_key='ВАШ_SECRET_KEY'
)

bucket_name = 'my-versioned-bucket'

# Включаем версионирование
s3.put_bucket_versioning(
    Bucket=bucket_name,
    VersioningConfiguration={'Status': 'Enabled'}
)

print(f'Версионирование включено для бакета {bucket_name}')

Загрузка объекта и создание версий

Попробуем загрузить объект example.txt несколько раз. Любые загрузки файлов с одинаковыми именами создают новые версии, а старые остаются доступными.


    file_name = 'example.txt'

with open(file_name, 'w') as f:
f.write('Первая версия файла')

s3.upload_file(file_name, bucket_name, file_name)

# Загружаем обновленную версию файла
with open(file_name, 'w') as f:
f.write('Вторая версия файла')

s3.upload_file(file_name, bucket_name, file_name)

Теперь S3-хранилище хранит все версии этого объекта, их можно удалять или делать основными.

Скриншот из панели управления.
Версионирование объектов в панели управления Selectel.

Запросим все версии конкретного файла из кода:


    versions = s3.list_object_versions(Bucket=bucket_name, Prefix=file_name)

for version in versions.get('Versions', []):
print(f"Версия: {version['VersionId']} | Последний модифицированный: {version['LastModified']}")

Восстановление предыдущей версии

В любой момент времени можно восстановить старую версию объекта как из API, так и через панель управления. Для этого перейдите на листинг объектов, выберете нужную версию и восстановите объект.

Скриншот из панели управления.
Восстановление объекта из версий замещает основной объект.

Заключение

Версионирование объектов в S3-хранилище — это удобный инструмент для работы с изменяющимися файлами, защиты данных от случайного удаления и ведения истории изменений. Используя интерфейс панели управления, готовый клиент или S3, можно легко управлять версиями, восстанавливать файлы и автоматизировать обработку данных.

В этой статья я использовал код только для демонстрации работы мультирегиональности в объектном хранилище Selectel. Для большего удобства рекомендую использовать готовые приложения, поддерживающие такую функциональность из коробки. К ним относятся:

Пользуясь случаем, выделю именно Rclone т. к. недавно мы стали официальными технологическими партнерами и получили нативную поддержку нашей услуги в этом клиенте.