ЖУРНАЛ «СТА» №2/2016
Если проверка была успешной, то на- чинается обычный процесс загрузки сервера. После того как первая часть системы полностью загрузилась, в том числе и операционная система, от логи- ки сравнения посылается сообщение драйверу системы о том, что первая часть находится в рабочем состоянии без резервирования (Single) и ждёт вво- да в эксплуатацию второй части, кото- рая пока находится в состоянии обслу- живания (Maintenance). Включение второй части системы Драйвер вводит в эксплуатацию вто- рую часть системы. Проводится диагно- стика, если есть проблемы, тест повто- ряется. При этом счётчик ошибок уве- личивается. При достижении макси- мального количества ошибок системная плата считается неисправной (Broken). Проверка версии BIOS После того как диагностика успешно пройдена, проверяется, совпадают ли версии прошивок на системных платах. В случае замены системной платы после аппаратного сбоя может оказаться, что новая плата будет иметь другую, обыч- но более свежую прошивку, чем та, на которой работает система. В этом случае выполняется понижение (даунгрейд) версии прошивки до той, на которой ра- ботает система. Это делается для того, чтобы избежать возможных проблем, связанных с использованием непроте- стированных версий прошивок, исходя из принципа «что раньше было хорошо, и сейчас ещё хорошо». Более того, в не- которых производственных отраслях, например таких, как фармацевтика и химическое производство, нормы и тре- бования по контролю качества и соот- ветствия выпускаемой продукции тре- буют при изменении компонентов, уча- ствующих в производственном процес- се, к которым относится и прошивка си- стемной платы, провести полную серти- фикацию производственного процесса. Синхронизация оперативной памяти На следующем этапе содержимое опе- ративной памяти первого сервера пере- даётся второму. Это делается во время работы, на лету – без прерывания вы- полнения запущенных программ. По- скольку в то же время происходит обра- ботка информации и содержимое памя- ти во время передачи может меняться, используется специальный алгоритм. Сначала выполняется передача содер- жимого всей памяти, так называемая фа- за Brownout, а затем повторная передача модифицированных страниц (Dirty Pages). Алгоритм Brownout интерактив- ный, поэтому, если страницы памяти интенсивно меняются и их невозможно передать за заданное число проходов, то доступ к ним приостанавливается – это так называемая фаза Blackout, когда они «замораживаются» и передаются на дру- гой сервер. Всё происходит в течение не- скольких десятков микросекунд и прак- тически незаметно для приложения. Дуплексный режим После синхронизации процессоры и оперативная память находятся в одина- ковом исходном состоянии и одновре- менно запускаются в работу. С этого мо- мента логика синхронизации контроли- рует оба вычислительных узла и ведёт их шаг в шаг по технологии Lockstep. Си- стема переходит в дуплексный режим (Duplex). Изоляция сбоев Дальше для контроля сбоев вступает в работу логика сравнения. С момента пе- рехода в дуплексный режим благодаря технологии Lockstep системы работают независимо друг от друга и полностью синхронно, используя данные из одного источника (одного дискового массива). Интеллектуальный арбитр – специаль- 26 СТА 2/2016 ОБ ЗОР / АППА РАТ НЫЕ С Р Е ДС Т В А www.cta.ru ОФИЦИАЛЬНЫЙ ДИСТРИБЬЮТОР ПРОДУКЦИИ ACME
Made with FlippingBook
RkJQdWJsaXNoZXIy MTQ4NjUy