Опыт построения систем сетевого резервного копирования
Одной из важных задач при эксплуатации информационных систем является обеспечение целостности и сохранности данных, ведь даже в самой надежной из них существует риск потери информации, жизненно важной для предприятия. Поэтому необходимо иметь механизм для быстрого восстановления потерянных данных. Это может быть обеспечено путем построения развитой системы резервного копирования, периодически создающей копии информации с целью ее последующего восстановления в случае частичного или полного разрушения. Кроме того, такая система может собирать и обслуживать архив корпоративных данных.
В большинстве случаев требуется, чтобы система резервного копирования функционировала в вычислительной сети, причем умела манипулировать данными и устройствами независимо от их расположения в этой сети. Такая полноценная сетевая система должна обеспечивать восстановление данных, распределенных по всем узлам вычислительной сети.
Концепция резервного копирования интуитивно понятна каждому пользователю ПК и администратору сети, но к системе резервного копирования, функционирующей в вычислительной сети, предъявляются особые требования. Ниже рассмотрим их более подробно, чтобы определить аппаратно-программные компоненты этой системы.
Функционирование по технологии клиент-сервер
В общем случае технология клиент-сервер подразумевает распределение обработки данных между узлами сети. Рассмотрим, как можно применить эту концепцию к системе сетевого резервного копирования. На сервере располагается компонент системы резервного копирования, называемый менеджером, который координирует ее работу. Функциями менеджера, как правило, являются: управление устройствами хранения данных, планирование работ резервного копирования, хранение оглавления архива резервных копий и другие действия координирующего характера.
Клиентские компоненты, или агенты, располагающиеся в различных узлах сети, работают под управлением менеджера системы резервного копирования. Они обеспечивают передачу сохраняемой информации менеджеру, а в случае восстановления - получение ее обратно и размещение на клиентской машине. Агенты не обязательно должны находиться на рабочих местах пользователей. Например, для обеспечения резервного копирования данных, хранящихся на сервере сети, агент может размещаться и на нем.
Преимуществами технологии клиент-сервер при реализации системы сетевого резервного копирования являются:
-
возможность использования одного устройства для хранения резервных копий с различных узлов сети;
-
централизованное планирование работ и управление ими;
-
локализация хранения резервных копий.
Следовательно, ее целесообразно использовать при построении систем резервного копирования для сохранения данных, распределенных в сети.
Обеспечение автоматизации работ резервного копирования
Процесс резервного копирования неизбежно включает много циклических операций, например профилактическое обслуживание устройств резервного копирования и чистку узлов лентопротяжного механизма стримера специальной кассетой. Необходимо также периодически перезаписывать информацию на носителях резервных копий. Так, ежедневная копия должна храниться неделю, а потом соответствующий носитель снова можно будет использовать.
Процесс перезаписи носителей резервных копий называется ротацией. Его поддержка вручную - дело весьма трудоемкое и к тому же таящее в себе возможность ошибки. Следовательно, система резервного копирования должна минимизировать число ручных операций и выполнять циклические работы в автоматическом режиме, в частности резервное копирование по расписанию, ротацию носителей, периодическое профилактическое обслуживание устройств этой системы.
Нужно отметить, что автоматизация работ является одним из главных факторов снижения затрат на сопровождение системы резервного копирования.
Поддержка гибких механизмов резервного копирования
В основном резервное копирование - это периодический процесс, исключением из которого является создание резервной копии данных, доступных только для чтения. В случае проведения работ резервного копирования по определенному циклу могут потребоваться различные механизмы создания резервных копий, например, бывает нецелесообразно делать резервную копию файла, который не изменялся после предыдущего копирования. Таким образом, система должна поддерживать разнообразные механизмы создания резервных копий, а также обеспечивать различные режимы сохранения.
Использование адекватного носителя резервной копии
Важная задача при разработке технологии резервного копирования - правильный выбор носителя резервной копии. В случае ошибки может либо произойти резкое удорожание системы, либо по мере развития сети параметры системы резервного копирования просто станут неадекватны возросшему объему данных.
Основными критериями выбора носителя являются объем сохраняемых данных, стоимость хранения единицы информации и скорость чтения/записи. В целом же выбор носителя определяется требованиями, предъявляемыми к системе сетевого резервного копирования.
Выполнение верификации и сжатия информации
Верификацией информации называется проверка корректности выполнения операций записи на носитель и чтения с него. Современные носители информации отличаются высокой надежностью, однако все равно следует проводить верификацию. Она может быть весьма различна: в простейших случаях сравниваются только контрольные суммы, а в более сложных - полные оригинал и копия.
Сжатие данных позволяет более эффективно использовать носитель, к тому же современные алгоритмы сжатия информации не требуют больших временных издержек.
Быстрое восстановление серверов сети после аварии
Сервер сети может прийти в нерабочее состояние по различным причинам, например из-за аварии системного жесткого диска или ошибок ПО, вызвавших разрушение системной информации. В данном случае восстановление сервера требует установки ОС, конфигурирования устройств, заведения учетных записей пользователей, генерации приложений и восстановления файловой системы. Все эти операции очень трудоемки, и при их выполнении могут возникнуть ошибки, что значительно усложнит восстановление сервера. Чтобы упростить этот процесс, нужно создать резервную копию всей информации с сервера, включая системные данные, и тогда можно будет в кратчайшие сроки ввести его в промышленную эксплуатацию без перегенерации ПО и восстановления вручную учетной информации.
Резервное копирование баз данных прикладных систем в оперативном режиме
Зачастую информационная система включает различные приложения клиент-сервер, которые должны функционировать круглосуточно. В частности, почтовые системы и системы коллективной работы (например, Lotus Notes), серверы баз данных (например, Oracle). Осуществить резервное копирование баз данных таких прикладных систем обычными средствами невозможно, ибо эти базы все время открыты. Подобные системы содержат собственные встроенные средства резервного копирования своих баз данных, но их использование, как правило, не вписывается в технологию резервирования других данных в общей информационной системе предприятия. Поэтому система резервного копирования должна обеспечивать сохранение баз данных приложений клиент-сервер.
Желательно также сохранять сетевые файлы, открытые различными приложениями, например Microsoft Office.
Поддержка гетерогенной среды
Современные вычислительные сети зачастую имеют гетерогенную структуру, следовательно, система сетевого резервного копирования должна эффективно функционировать в такой вычислительной среде. В частности, поддержка гетерогенности подразумевает резервное копирование данных, расположенных на одной аппаратно-программной платформе, на устройство, подключенное к серверу, функционирующему на другой. Например, система резервного копирования должна позволять переписывать данные с сервера DEC Alpha под управлением Microsoft Windows NT на устройство, подключенное к серверу под управлением Novell NetWare.
Поддержка гетерогенной среды также является необходимым условием расширения системы резервного копирования в случае включения в сеть новых аппаратно-программных платформ.
Развитые средства управления и мониторинга
Для эффективного управления системой резервного копирования в сети необходимы такие средства, которые позволили бы организовать его на одном рабочем месте. Они должны поддерживать определенный набор операций и возможностей по контролю за работой системы резервного копирования.
Так как в процессе резервного копирования могут возникать различные нештатные ситуации, система должна предоставить широкий набор средств для оповещения о событиях, происходящих в процессе ее работы, чтобы уведомить о них администратора, в частности, послать ему по сети сообщение.
Аппаратно-программные компоненты системы резервного копирования
Определив требования, предъявляемые к средствам резервного копирования, рассмотрим теперь способ их реализации. Система сетевого резервного копирования состоит из аппаратных средств и программного обеспечения. Аппаратная часть предназначена для записи и хранения резервных копий с целью восстановления с них данных, а сам процесс сетевого резервного копирования реализуется программной частью. Она создает резервные копии, манипулирует носителями информации, управляет процессом резервного копирования и восстановления, поддерживает расписание работ, обеспечивает управление устройствами, а также реализует другие функции.
Аппаратные средства системы резервного копирования
Прежде всего необходимо выбрать носитель для хранения резервных копий. При этом следует обращать внимание на такие его характеристики, как емкость, стоимость хранения единицы информации и скорость чтения/записи. В качестве носителя наиболее часто используются жесткие диски, магнитооптика и магнитные ленты. В табл. 1 приведены усредненные данные для таких носителей; для конкретных моделей цифры могут отличаться, но их соотношения останутся теми же.
Для разового сохранения небольшого количества информации вполне подойдет жесткий диск или магнитооптика. Однако использовать жесткий диск для сохранения большого объема информации нецелесообразно из-за его относительно высокой цены. Основным недостатком магнитооптики является очень низкая скорость записи, а при использовании систем резервного копирования основной объем работ связан именно с записью данных, так как восстановление их требуется только эпизодически. Когда же речь заходит о выборе аппаратного обеспечения для резервного копирования и последующего хранения больших объемов данных, да к тому же в автоматическом режиме, то рекомендуются ленточные накопители.
По скорости восстановления современные накопители на магнитных лентах не уступают магнитооптике, а по скорости записи даже превосходят. Кроме того, стоимость хранения на них информации ниже, чем на других носителях.
Поэтому, что подтверждается опытом внедрения систем сетевого резервного копирования, пользователи, сначала выбравшие магнитооптику, по мере роста объема сохраняемой информации заменяют их магнитными лентами.
Для работы с ленточными носителями в системах резервного копирования используются накопители с автоматической подачей кассет, или "библиотекари" (в англоязычной литературе - autochanger).
"Библиотекарь" состоит из стримера (drive), предназначенного для записи информации на магнитную ленту и чтения с нее, и робота (robot), служащего для загрузки кассеты из магазина в стример и извлечения из него.
Стример включает магнитную головку для чтения/записи и лентопротяжный механизм. Он может работать только с одной кассетой. В состав робота входят магазин кассет и механизм подачи требуемой кассеты в стример и извлечения из него.
Производители "библиотекарей" зачастую разрабатывают только роботы, в которые вставляют стримеры, изготовленные различными фирмами, и продают полученные устройства под своей маркой.
Во всех выпускаемых стримерах реализованы технологии чтения/записи, обеспечивающие высокие плотность записи и надежность хранения большого объема информации.
Наилучшими являются DLT-стримеры, характеризующиеся отличной скоростью передачи данных. Производители "библиотекарей" в своих новых моделях в основном используют именно их. Емкость одной DLT-кассеты - 70 Гбайт, а скорости чтения/записи в последних моделях - до 600 Мбайт/мин.
Достаточно широко распространены также стримеры DDS-2 и DDS-3, работающие с кассетами емкостью 24 Гбайт и обеспечивающие чтение/запись со скоростью до 70 Мбайт/мин.
Самый известный производитель "библиотекарей" на магнитных лентах - американская компания ADIC (Advanced Digital Information Corporation), уже выпустившая пять поколений простых и надежных роботов, построенных по принципу минимального числа перемещений по осям координат. На тестовых испытаниях "библиотекари" ADIC выполняли непрерывно 500 тыс. операций по загрузке кассеты в стример и удалению из него без единого сбоя. Наиболее популярными из выпускаемых компанией ADIC являются модели на основе DLT-стримера. Самая простая модель VLS400 на базе стримера DLT4000 имеет магазин на семь кассет по 40 Гбайт каждая и обеспечивает скорость чтения/записи до 180 Мбайт/мин.
Самые мощные "библиотекари" ADIC на базе DLT-стримера представлены семейством Scalar. В них можно поместить до 58 кассет емкостью 40 или 70 Гбайт, а также до четырех DLT-стримеров, работающих параллельно. Таким образом, их производительность достигает 2400 Мбайт/мин.
Кроме того, популярны "библиотекари" на базе стримеров DDS-2 и DDS-3, имеющие магазин на 12 кассет по 24 Гбайт каждая. Они обеспечивают скорость чтения/записи до 140 Мбайт/мин.
Программное обеспечение системы резервного копирования
На рынке программных продуктов для организации резервного копирования уже появились признанные лидеры. Наиболее функционально полным и развитым продуктом является, по нашему мнению, система ARCserve компании Computer Associates.
Текущая версия ARCserve прекрасно совместима со всеми моделями "библиотекарей" и одиночных устройств компании ADIC, а также поддерживает другие внешние запоминающие устройства, включая популярную магнитооптику фирмы Hewlett-Packard.
Для примера рассмотрим, удовлетворяет ли решение, построенное на основе ARCserve и "библиотекарей" ADIC, требованиям, предъявляемым к системе резервного копирования.
Функционирование по технологии клиент-сервер
Система ARCserve позволяет производить удаленное резервное копирование серверов и рабочих станций. Остановимся на некоторых аспектах использования "библиотекарей", предназначенных для сетевого резервного копирования данных. Возможны два способа их применения: во-первых, на каждый сервер устанавливается выделенный "библиотекарь", во-вторых, один "библиотекарь" обслуживает несколько серверов в сети.
Первый способ является более предпочтительным. Его преимущества заключаются в высокой скорости копирования и восстановления данных, а также в возможности распараллеливания процессов резервного копирования серверов. При этом на каждый сервер устанавливается система ARCserve, отвечающая за сохранение данных и восстановление их с этого сервера.
Второй способ может оказаться более дешевым, чем первый, но для него характерны более высокая загрузка сети и более низкая скорость резервного копирования и восстановления. При этом на сервер, к которому подключен "библиотекарь" (сервер резервного копирования), устанавливается серверная часть системы ARCserve, а на локальные серверы - различные виды клиентов, обеспечивающих передачу данных на сервер "библиотекаря". Например, для удаленного резервного копирования данных с серверов NetWare на них можно ставить специализированный высокоскоростной агент сохранения - Push Agent.
Выбор способа использования устройств резервного копирования зависит от топологии сети, характера сохраняемых данных, типа и степени загрузки передающей среды.
Обеспечение автоматизации работ резервного копирования
В системе ARCserve автоматизация резервного копирования заключается в поддержке расписания работ и возможности управления роботом "библиотекаря" с помощью так называемого "автопилота" (Autopilot), который осуществляет циклы резервного копирования продолжительностью до года.
Система ARCserve поддерживает развитые схемы ротации носителей резервных копий, например, самая популярная из определенных - GFS (Grandfather-Father-Son) - обеспечивает хранение резервных копий с точностью до дня в течение недели, с точностью до недели - в течение месяца, с точностью до месяца - в течение года. Администратор системы ARCserve может модифицировать эту схему, использовать какую-нибудь другую из определенных или реализовать схему ротации по своему желанию.
При реализации любой схемы ротации носителей ARCserve автоматически предотвращает случайное перезаписывание нужной информации.
При использовании "библиотекарей" система ARCserve обеспечивает чистку лентопротяжного механизма по заданному расписанию и в определенном режиме. Для этого в одно из гнезд магазина "библиотекаря" вставляется чистящая кассета.
Поддержка гибких механизмов резервного копирования
Система сетевого резервного копирования ARCserve создает резервные копии данных трех видов:
-
Полная (Full Backup), представляющая собой точный образ сохраняемых данных;
-
Дифференциальная (Differential Backup), содержащая только те файлы, которые изменились после создания последней полной копии;
-
Инкрементальная (Incremental Backup), включающая только файлы, которые изменились после создания последней полной, дифференциальной или инкрементальной копии.
Система ARCserve позволяет сохранять на одном носителе несколько сессий резервного копирования, что обеспечивает уменьшение времени резервного копирования, экономию памяти на внешних носителях и увеличение интервала между ручными заменами кассет в магазине "библиотекаря".
Использование адекватного носителя резервной копии
Система ARCserve поддерживает магнитные ленты, магнитооптику, оптические диски однократной записи, а также любые локальные и сетевые устройства, которые могут быть доступны как тома данных. Такой широкий ассортимент позволяет использовать систему ARCserve для реализации резервного копирования данных различной структуры и объема.
Выполнение верификации и сжатия информации
При сохранении данных ARCserve поддерживает следующие режимы верификации:
-
проверку циклических контрольных сумм (CRC);
-
cканирование содержимого ленты; при этом после создания резервной копии проверяется совпадение имен файлов на носителе и жестком диске;
-
проверку части информации на соответствие копии оригиналу; в этом режиме после записи данных на внешний носитель определяется, соответствует ли фрагмент сохраненной информации на жестком диске информации на носителе;
-
полную верификацию, когда после сохранения всей информации проверяется ее соответствие копии.
Верификация требует дополнительных временны`х затрат, поэтому к выбору ее режима следует подходить осторожно. При сохранении больших объемов информации наиболее целесообразным является второй способ резервного копирования.
Пакет ARCserve обеспечивает сжатие данных при сохранении. Многие устройства записи на магнитную ленту поддерживают сжатие данных на аппаратном уровне и по среднестатистическим оценкам сжимают информацию в 2 раза.
Быстрое восстановление работы серверов сети после аварии
Для эффективного восстановления серверов под управлением Microsoft Windows NT и Novell NetWare после аварии система ARCserve предлагает опцию аварийного восстановления (Disaster Recovery Option). Ее использование заключается в следующем. Для сервера сети периодически создается комплект дискет аварийной копии. Когда он имеется в наличии, то для восстановления сервера после аварии необходимо подключить к серверу устройство резервного копирования с последней копией данных и произвести загрузку с первой дискеты из комплекта аварийной копии.
После этого сам сервер, все приложения на нем, все пользователи, все ресурсы и вся файловая система будут восстановлены полностью в автоматическом режиме.
Резервное копирование баз данных прикладных систем
Для оперативного сохранения баз данных прикладных систем ARCserve содержит ряд специальных программ-агентов, каждая из которых также функционирует как ее клиент.
В настоящий момент эта система предлагает агенты для оперативного сохранения баз данных следующих популярных систем клиент-сервер: Lotus Notes, Microsoft Exchange Server, Microsoft SQLServer, Oracle Server, SAP R/3, Btrieve, Centura (Gupta) SQLBase, Sybase SQL Server, Novell GroupWise.
Система ARCserve имеет также агент для сохранения открытых файлов, например приложений семейства Microsoft Office.
Поддержка гетерогенной среды
ARCserve разработана как гетерогенная система сетевого резервного копирования. Ее серверная часть функционирует под управлением Microsoft Windows NT, Novell NetWare и различных ОС семейства Unix. Клиентами системы могут быть удаленные серверы и рабочие станции под управлением Microsoft Windows NT, Novell NetWare, Unix, Microsoft Windows 95, Microsoft Windows 3.x, MS DOS, OS/2, MacOS.
Развитые средства управления и мониторинга
Управление системой ARCserve и резервным копированием осуществляется с помощью интерактивной графической программы-менеджера, функционирующей под управлением Microsoft Windows 3.x, Windows 95 и Windows NT. Она обеспечивает задание регламента работ, управление устройствами, поиск требуемой информации в архивах данных, сбор информации, статистических данных и др.
Для оперативного извещения о событиях, происходящих в процессе копирования, система ARCserve поддерживает оповещение через сеть, пейджер, SMTP, факс и даже может выводить протокол всех событий на принтер.
* * *
В заключение сравним системы ARCserve и NetWorker компании Legato. Оба продукта в целом выполняют схожие функции, однако, по нашему мнению, ARCserve является более предпочтительной. В табл. 2 приведены результаты сравнения этих двух систем резервного копирования (по состоянию на 1.02.98. - Прим. ред.).
Возможность ARCserve NetWorker
-
Поддержка RAID-массивов внешних накопителей
-
Аварийное восстановление с удаленного устройства
-
Создание низкоуровневого образа тома
-
Чтение резервных копий с других платформ
-
Администрирование через Internet
-
Копирование информации с одного внешнего носителя на другой
-
Интеграция с антивирусным пакетом
Cледует уточнить, что, хотя современные накопители на внешних носителях обеспечивают высокую надежность сохранности информации, в некоторых информационных системах она считается недостаточной. Для обеспечения максимальной надежности система ARCserve при сохранении данных может автоматически производить дублирование информации на несколько носителей. В этом случае, если при восстановлении информации на одном из них возникнут некорректируемые ошибки чтения, соответствующий фрагмент данных будет автоматически считан с другого носителя. Логически схемы дублирования, предлагаемые системой ARCserve, подобны схемам RAID 1 и RAID 5, применяемым в массивах накопителей на жестких дисках.
Интеграция с антивирусным пакетом предотвращает попадание в архивы данных файлов, зараженных вирусами. ARCserve тесно интегрирован с сетевым антивирусным пакетом InocuLAN компании Computer Associates, который, в частности, сканирует сохраняемую информацию на предмет наличия вирусов.
В целом наш опыт реализации систем резервного копирования свидетельствует, что ARCserve - наиболее прогрессивное программное решение для организации резервного копирования в гетерогенных сетях.