Error & Tank
Я тут как раз думал о том, как резервные системы обеспечивают безопасность важных объектов, когда что-то выходит из строя. Интересовался, как вообще этот переключение на резерв происходит?
Избыточность – это просто красивый способ сказать "иметь запасной и переключаться, когда основной начнет сбоить". Запускаешь две идентичные системы параллельно, одну держишь в резерве или в режиме пониженного энергопотребления, и есть сторожевой таймер, который проверяет основную систему. Если проверка не проходит или основная выдает ошибку, сторожевой таймер мгновенно дает команду резервной системе взять на себя. Всё дело в быстром обнаружении, минимальном простое и в том, что резервная система обычно просто копия основной, поэтому перенастраивать ничего на ходу не нужно. По сути, та же логика, что и в серьезной компьютерной лаборатории, только с гораздо большим количеством бумажек и страховок.
Звучит неплохо, только следи, чтобы за "сторожем" постоянно глаз был. Одна ошибка – и весь запасной план полетит в тартарары.
Понял, но помни, этот сторож – просто программный код. Если в коде ошибка или сеть заглючит, вся конструкция рухнет в одно мгновение. Лучше тестировать почаще, чем рассчитывать на него от случая к случаю.
Ладно, ни одному элементу нельзя доверять на все сто. Запускай тесты сторожевого режима так же часто, как и проверки оборудования. Никаких сюрпризов не должно быть.