Серверные и сетевые решения для предприятий

В корзине 0 товаров на сумму 0 р

  |  

Репликация данных на большие дистанции с RPO равным нулю

Среди задач, которые решают IT-подразделения важное место занимает защита данных от негативного воздействия внешних факторов. Традиционным и наиболее распространенным средством защиты является механизм репликации. Главным недостатком этого механизма является то, что с его помощью можно синхронизировать данные только между двумя центрами хранения. Нужно отметить, что для многих организаций этого вполне достаточно. Однако, если заказчик требует нулевого значения RPO, возникает потребность в синхронной репликации. У синхронной репликации, однако, есть ограничение на расстояние между дата-центрами: около 100 км. В этом случае, если два центра хранения расположены близко друг от друга, то в случае стихийного бедствия пострадают оба ЦОД, а значити данные могут быть потеряны.

Чтобы обеспечить высокий уровень защиты данных, необходимо обеспечить выполнение следующих условий:

  • Репликация набора данных должна производиться между тремя дата-центрами.
  • Показатель RPO при отказе любого из трех центров должен быть равен нулю.
  • В случае последовательного отказа двух дата-центров работа должна быть продолжена.

Для тех, кто нуждается в таком высоком уровне защиты данных, компания HPE разработала специальное решение HPE 3PAR Synchronous Long Distance (SLD) – репликацию данных на большие расстояния без потерь. Рассмотрим как работает это решение.

Основные виды репликации

Системы хранения данных семейства HPE 3PAR поддерживают три режима репликации:

  • Synchronous – синхрнонный режим, показатель RPO равен нулю.
  • Asynchronous Periodic – асинхронный периодический режим, минильное значение RPO равно 5 минутам.
  • Asynchronous Streaming – асинхронный потоковый режим, показатель RPO равен приблизительно 10 секундам.

Все три режима поддерживают консистентность данных при репликации.

Отдельно нужно отметить, что при асинхронном периодическом режиме используются мгновенные снимки, которые создаются через определенный временной интервал. На удаленный массив реплицируются только блоки, которых не было в предыдущем снимке. При асинхронном потоковом режиме новые блоки сначала накапливаются в локальном массиве (доли секунды), а затем реплицируются.

Возможны три варианта организации транспортного уровня репликации.

  • Remote Copy over Fibre Channel (RCFC): в качестве канала используется сеть FibreChannel, для репликации используются порты FC массива.
  • Remote Copy over Internet Protocol (RCIP): каналом передачи является сеть IP, при репликации задействованы встроенные порты IP масива.
  • Remote Copy over FCIP (Fibre Channel over IP): передача данных осуществляется через сеть IP, но для репликации используются порты FC массива. Необходимы дополнительные преобразователи протоколов FC-IP. Решение поддерживает репликацию один-к-одному (между двумя массивами, one-to-one) и многие-ко-многим (N массивов реплицируют данные на другие M массивов, максимальное возможные значения M и N равны четырем). Пример конфигурации приведен на рисунке ниже.

Рис.1. Репликация многие-ко-многим. Каждый массив копирует данные на 4 других массива. Репликация во всех направлениях может быть двунаправленной. Подразумевается репликация разных томов на разные массивы. Кроме этих двух вариантов репликации доступен специальный режим Synchronous Long Distance (SLD). Он обеспечивает одновременную репликацию одного и того же набора данных с одного массива на два других. Разберем механизм работы подробнее.

Как работает SLD

При работе SDL выполняется репликация с одного массива (A) на два других (B и C). На один из них (B) репликация выполняется в синхронном режиме, на второй (C) – в асинхронном периодическом режиме. Наглядно это изображено на рисунке 2.

Рис.2. схема SLD.


Массивы A и B придется размещать в относительной близости друг от друга, это расстояние будет определяться максимально допустимым временем задержки между двумя массивами (RTT), которое для синхронной репликации составляет 10 милисекунд. Зато массив C модет быть размещен достаточно далеко от массивов A и B. Здесь максимальное расстояние так же будет определяться показателем RTT, но его значение для асинхронной периодической репликации составляет уже 120 милисекунд. Отдельно скажем о показателе RPO. Согласно требованиям этот показатель должен быть равен нулю, но из-за того, что массив C расположен на значительном расстоянии от массива-источника, оказывается, что технология SLD – единственный способ обеспечить переключение на удаленный массив С без потери данных.

Механизм работает следующим образом: в штатном режиме осуществляется репликация данных с массива A на массивы B и С, между которыми настроена асинхронная периодическая репликация. В штатном режиме она пассивна (на рисунке 2 отмечена пунктиром). В случае отказа основного массива A эта репликация активируется автоматически, происходит копирование данных, которые были реплицированы на массив B, но не успели скопироваться на массив C.

После того, как массивы B и C будут синхронизированы, в качестве основного может быть выбран любой из них. Обратите внимание, что все данные, записанные на массив A будут сохранены (RPO = 0). Далее репликация между массивами B и C будет выполняться штатно, обеспечивая дальнейшую непрерывную защиту данных после отказа одного из трех хранилищ.

Затем, когда работа массива A будет восстановлена, данные, записанные на вторые два массива, будут реплицированы и на массив A. После этого можно вернуться к штатной схеме работы, где массив A используется как основной.

Важно иметь в виду два момента:

  • Массивы A и B могут использоваться одинаково, т.е. они оба могут быть одновременно главными массивами. В таком случает один набор данных реплицируется с массива A на массивы B и C, а другой набор данных – с массива B на массивы A и C.

Механизм SLD может использоваться одновременно с технологией 3PAR Peer Persistence. Это даст возможность полностью автоматизировать переключение между массивами А и В. 3PAR Peer Persistence обеспечивает полностью прозрачное переключение хостов между двумя массивами (в нашем случае между A и B) и позволяет перемещать виртуальные машины онлайн.

03.03.2017 10:25:00

К другим статьям