Способы надежного хранения информации.

Надежность чего-либо — понятие чисто статистическое. Мы вправе лишь сказать, что вероятность поломки одного из тысячи дисков в течение года составляет столько-то процентов. Однако никто не знает, какой именно винчестер сломается и в какой день.

Единственный способ уберечь информацию — держать ее копии на нескольких носителях одновременно. Достаточно, чтобы хотя бы один экземпляр из нескольких оставался цел в данный момент времени. Вероятность одновременного наступления ряда независимых событий равна произведению вероятностей каждого из них. Расчет не строго научный, но для практики вполне приемлемый!

Существуют два подхода:

    - делать копии время от времени;

    - записывать и считывать данные на нескольких носителях одновременно.

Первый способ принято называть резервным копированием: один носитель — «рабочий», а остальные хранят его копии разной степени давности. Недостаток резервного копирования в том, что любая копия уже устарела по сравнению с текущим состоянием рабочего экземпляра.

Однако в этом же и достоинство метода! Например, на «рабочем» носителе возникли смысловые ошибки. Пользователи или вредоносные программы удалили файлы или внесли в них изменения, ошибочные по смыслу. Формально вся информация цела, но это уже не та информация, которая нам нужна! Среди резервных же копий обычно находится хоть одна с неискаженным исходным вариантом данных.

Второй способ — синхронная работа нескольких носителей, дублирование в реальном времени. В простейшем случае это зеркалирование — два диска являются идентичными копиями друг друга. Они совершенно равноправны и равноценны. В более сложных вариантах каждый из нескольких дисков частично несет сами данные, а частично — коды коррекции ошибок для остальных дисков массива.

Недостатки дублирования

Одна проблема дублирования заключается в удорожании хранения единицы объема данных по сравнению с одиночным диском — при зеркалировании стоимость возрастает ровно вдвое, а при других вариантах несколько меньше. Другой недостаток дублирования в том, что оно в принципе не способно защитить от смысловых ошибок.

Поэтому в ответственных случаях разумно сочетать оба метода. Пусть дублирование обеспечит текущую защиту данных, а резервное копирование даст возможность вернуться к одному из прежних состояний.