Аппаратно-программные средства периферийных устройств системы сбора показаний счетчиков тепловой энергииРефераты >> Программирование и компьютеры >> Аппаратно-программные средства периферийных устройств системы сбора показаний счетчиков тепловой энергии
Ошибки вследствие воздействия окружающей среды. Ошибки этого типа могут возникать в результате воздействия электромагнитного излучения при недостаточном экранировании или вследствие неисправностей оборудования кондиционирования воздуха.
Ошибки вследствие отклонения характеристик источников питания. Резкое возрастание напряжения источника питания может серьезно снижать долговечность элементов электронной аппаратуры. Вычислительные машины чувствительны даже к кратковременным понижениям и повышениям напряжения, поэтому они должны иметь соответствующую защиту. Заметим, что при возникновении отказа ЭВМ установить его истинную причину бывает нелегко, и причины многих ошибок часто остаются необъясненными [8].
3.4.2. Классификация неисправностей
Основными причинами сбоя в работе ЭВМ являются устойчивые отказы элементов аппаратного оборудования, временное ухудшение характеристик элементов и внешние воздействия на работу вычислительной системы. Для моделирования и оценки надежности ЭВМ удобно классифицировать неисправности по временному признаку, разделяя их на постоянные и перемежающиеся.
Постоянные неисправности часто могут вызываться катастрофическими отказами элементов. В этом случае отказ элемента является необратимым и устойчивым, а отказавший элемент подлежит ремонту или замене. Такие неисправности характеризуются большой длительностью устранения, а интенсивность соответствующих отказов зависит от условий окружающей среды. Так, например, обычно элемент характеризуется различными интенсивностями отказов во включенном и выключенном состояниях.
Перемежающиеся неисправности вызываются временным ухудшением характеристик элементов или такими внешними воздействиями, как электрические наводки, снижение напряжения и импульсные помехи. Подобные неисправности характеризуются ограниченной продолжительностью существования, и для их устранения не требуется ремонта или замены элементов. Эти неисправности проявляются в виде перемежающихся отказов.
3.4.3. Основные подходы к оценке надежности ЭВМ
Надежность вычислительной машины, как и любой другой физической системы, можно повысить, не прибегая к резервированию. В этом случае используются высоконадежные элементы и схемы с большим запасом надежности и уделяется повышенное внимание технологии изготовления и сборки. Такой подход предусматривает предотвращение неисправностей и бессбойную работу аппаратных средств. В течение долгого времени считалось, что без резервирования невозможно создать сверхнадежные вычислительные системы, необходимые, например, для проведения исследований космического пространства и управления наземными или бортовыми системами в реальном масштабе времени. В последние годы надежность элементов ЭВМ существенно возросла, что позволило создавать более надежные не резервированные системы. Однако повышение надежности сопровождается усложнением вычислительных систем и увеличением числа входящих в них элементов.
Другим подходом к созданию надежных вычислительных систем является обеспечение их отказоустойчивости. Такой подход не исключает появления неисправностей, но их неблагоприятное воздействие на работу системы предотвращается или минимизируется путем введения той или иной формы избыточности. Такая отказоустойчивая вычислительная система может сохранять работоспособность при заданном числе отказов, либо правильно выполнять программу при отказе определенного числа элементов. Свойство отказоустойчивости обеспечивается защитным резервированием, которое может осуществляться тремя различными способами:
– введением избыточных логических элементов или резервированием на уровне вычислительных машин;
– введением избыточности в систему программного обеспечения, т. е. созданием дополнительных программ, обеспечивающих защиту от ошибок или их исправление;
– введением временной избыточности, благодаря которой становится возможным повторение машинных операций.
С функциональной точки зрения введение избыточности может осуществляться в статическом или динамическом режиме.
3.4.4. Статическое резервирование
Влияние неисправностей можно исключить путем введения дополнительного оборудования, с тем чтобы при отказе одного из резервированных элементов выходные данные функционального модуля не менялись. Влияние неисправного элемента мгновенно и автоматически блокируется благодаря наличию постоянно включенных и одновременно действующих элементов. Такое резервирование называется статическим, так как блокирование отказа осуществляется автономно, без вмешательства в работу системы через какие-либо оконечные устройства ввода-вывода.
Резервирование со схемой голосования, являющееся наиболее важной формой блокирования отказов, было предложено автором работы, который разработал и проанализировал схему тройного резервирования элементов с мажоритарной функцией голосования. Резервирование такого рода стало экономически целесообразным с развитием технологии интегральных схем. Одним из интересных примеров применения этого подхода является ЭВМ пусковой установки ракеты “Сатурн-5”. В этой вычислительной машине применяется тройное резервирование модульной схемы с мажоритарными элементами в центральном процессоре и дублирование в основном запоминающем устройстве.
Для обеспечения отказоустойчивости систем передачи и хранения данных используются разработанные в технике связи коды с обнаружением и исправлением ошибок, а также специальные коды, предназначенные для быстрого кодирования и декодирования. В работе отмечается, что стоимость таких схем примерно в 1,5 раза больше стоимости схем без резервирования.
3.4.5. Динамическое резервирование
При динамическом резервировании влияние неисправностей может проявляться на выходах системы, однако предусматриваются средства их обнаружения, диагностики и устранения. Если возможность вмешательства человека исключается, то посредством динамического резервирования системе придается свойство самовосстанавливаемости. Такой вид резервирования известен еще как резервирование замещением. Исправление ошибок обеспечивается за счет реализации повторных вычислений, например, способом обратного прогона программы до возвращения к некоторой исходной точке программы.
3.4.6. Гибридное резервирование
В этой схеме в любой момент времени три или большее число модулей соединены с мажоритарным элементом. При отказе какого-либо модуля обнаруживается несовпадение его результатов с выходами двух других, и он заменяется резервным [8].
3.4.7. Расчет времени наработки на отказ
Электрический режим использования элементов характеризуется коэффициентом нагрузки:
Кн = Nраб/ Nном ,
где Nраб – нагрузка на элемент в рабочем режиме;
Nном – номинальная, допустимая по ТУ нагрузка.
Контроллер – изделие с последовательным соединением элементов. Следовательно отказ хотя бы одного элемента приводит к отказу всего устройства.
Интенсивность отказов изделия L0 есть сумма сумма интенсивностей отказов всех входящих в изделие элементов: