Дедупликация

Дедупликация, или история, которая произошла на праздниках

блог

Сегодня поговорим о технологии, которую любят за экономию – о дедупликации

В среде виртуализации дедупликация действительно работает великолепно. Причина проста: виртуальные машины часто очень похожи друг на друга. Один и тот же шаблон операционной системы, одинаковые библиотеки, одинаковые файлы. Когда создаются десятки или сотни клонов таких машин, их данные фактически дублируются.

Дедупликация решает эту проблему. Система хранения разбивает данные на блоки и хранит одинаковые блоки только один раз. Если тысяча виртуальных машин содержит один и тот же файл, то физически он будет храниться в системе хранения всего один раз. Экономия может быть огромной.

Но у этой технологии есть особенности. Поделимся, одной реальной историей, от которой у администратора точно добавилось седых волос.

История произошла с системой, где хранилось больше тысячи почти одинаковых виртуальных машин. По требованиям безопасности обновления операционных систем на них долгое время были отключены. И обычно запуск обновлений происходит в три этапа, начиная с малых групп корпоративных пользователей. Но в нашей истории случился человеческий фактор. На январских праздниках администратор пришел на плановое обслуживание и включил обновления без предварительной валидации. Все машины начали менять свои файлы одновременно. В режиме дедупликации это означало одно: ранее одинаковые блоки стали различаться. За считанные минуты объем реально используемого пространства резко вырос. Система хранения быстро исчерпала свободное место и фактически остановилась. Виртуальные машины зависли в процессе обновления, им просто некуда было записывать новые данные.

Это не ошибка технологии. Это напоминание о том, что любой инструмент нужно использовать аккуратно, понимая характер нагрузки и поведение данных.

Просмотры: 126
Предыдущая запись
Снапклоны: когда нужна копия, но останавливать систему нельзя
Меню