ЖУРНАЛ «СТА» №2/2016
ный чипсет Stratus Albireo – сверяет ре- зультаты операций, в случае расхожде- ния выбирает правильный результат и изолирует сбойный компонент, который определяется на основе мониторинга в реальном масштабе времени более 500 параметров системы и отслеживания цепочки событий (сообщения, датчики, триггеры). Система пытается самостоятельно вос- становить работоспособность с мини- мальными усилиями. Так, если сбой про- исходит в оперативной памяти, напри- мер, какое-то несоответствие в опреде- лённый момент времени, то система пы- тается перевести её в синхронный режим, выполняя кратковременное затемнение участка соответствующей области памя- ти. Если этого сделать не удалось, данный компонент помечается как неисправный и требуется его замена. Если сбой удалось устранить, то система продолжает рабо- ту, а счётчик ошибок компонента (счёт- чикMTBF–Mean Time Between Failures) увеличивается. Далее выполняется алго- ритм работы со счётчиками MTBF. Блок ввода-вывода В отличие от вычислительного блока в блоке ввода-вывода используются раз- личные каналы (протоколы) и устрой- ства. И в связи с тем, что далеко не каж- дый протокол подходит для технологии Lockstep, а также не существует стан- дартных протоколов, позволяющих привести PCI-адаптеры в одинаковое начальное состояние, реализовать тех- нологию, похожую на Lockstep, не пред- ставляется возможным, поэтому для блока ввода-вывода применяются раз- ные виды резервирования в зависимо- сти от вида канала (протокола) ввода- вывода. Для серверов существует четыре ос- новных класса каналов ввода-вывода: ● дисковый ввод-вывод; ● сетевой интерфейс (Ethernet); ● консольные интерфейсы (VGA, USB); ● другие асинхронные и синхронные интерфейсы. Рассмотрим процессы, происходя- щие в блоке ввода-вывода, по аналогии с процессами в блоке центрального процессора/памяти. Включение первого блока После включения модули ввода-выво- да получают команду на тестирование. Если результат теста отрицательный, ав- томатически выполняется попытка вве- сти в эксплуатацию другую плату. В слу- чае успешного тестирования проверяют- ся все PCI-устройства, а также совмести- мость со стандартом PCI Express. Если полной совместимости нет, эти адаптеры исключаются, так как надёжная работа не гарантируется и заметно ухудшается отказоустойчивость. Для обеспечения высокой готовности необходимо исполь- зовать только сертифицированные PCI- устройства. Не прошедшие тестирование адаптеры объявляются неисправными. Загрузка После того как плата заработала (в одиночном режиме – Simplex), про- цессорный модуль получает доступ к за- грузочному диску. Может оказаться, что из-за аппаратных сбоев загрузочный диск не будет найден. Это состояние бу- дет перехвачено по таймеру и будет вы- полнена попытка загрузиться с другого модуля ввода-вывода (режим отказо- устойчивой загрузки). Включение второго блока После того как операционная систе- ма загрузилась, устанавливаются драй- веры диагностики и обслуживания и инициализируется ввод в эксплуатацию второго модуля ввода-вывода. Выпол- няется диагностика системной платы и затем всех PCI-устройств. ОБ ЗОР / АППА РАТ НЫЕ С Р Е ДС Т В А 27 СТА 2/2016 www.cta.ru
Made with FlippingBook
RkJQdWJsaXNoZXIy MTQ4NjUy