Главным нормативным документом, устанавливающим номенклатуру терминов и их определения, в области надежности техники является ГОСТ 27.002-89. «Надежность в технике. Термины и определения.». Применительно к терминологии в области надежности человеко-машинных систем в 1978г. выпущены “Методические рекомендации по терминологии в области надежности эргатических систем (систем ”человек-техника”)”, (авторы А.И. Губинский, Ю.П. Гречко и В.Г. Евграфов.)
В последующем изложении вопросов надежности будет использоваться термин «объект» в широком смысле слова, т.е. как система в целом или отдельная ее часть, или первичный элемент. В дальнейшем также будут использоваться использовать термины “система”, ”часть системы”, ”элемент системы”.
Надежность - сложное свойство объекта сохранять во времени в установленных пределах значения всех параметров, характеризующих способность выполнить требуемые функции в заданных режимах и условиях применения, технического обслуживания, ремонтов, хранения и транспортирования. Надежность является одним из важнейших сложных свойств объекта, совокупность которых образует его качество. Эффективность - это мера проявления качества объекта (или некоторой совокупности отдельных его свойств) в различных режимах эксплуатации. Степень реализации при проектировании и изготовлении и проявления в процессе эксплуатации конкретного свойства измеряется показателем.
Существуют единичные и комплексные показатели надежности, характеризующие единичные и комплексные свойства, в совокупности образующие сложное свойство надежности АСОИУ.
В отличие от таких свойств системы как быстродействие, производительность, емкость памяти, потребляемая мощность, масса и др., которые оцениваются для некоторого момента времени, надежность характеризует зависимость “точечных” значений показателей либо от времени использования системы, либо от наработки.
Надежность - сложное свойство системы, зависящее от времени. Оценка надежности может быть ориентирована либо на прошедшее время (в этом случае говорят, что система до данного момента проработала такое-то количество часов, поэтому она характеризуется таким-то значением показателя надежности), либо на будущее время (в этом случае говорят, что данная система, если она будет использоваться в данных условиях, будет обладать такой-то надежностью).
Отдельными сторонами (единичными свойствами) надежности объекта принято считать:
1. Безотказность - свойство объекта непрерывно сохранять работоспособность в течение некоторого времени, или некоторой наработки.
2. Ремонтопригодность - свойство объекта, заключающееся в приспособленности его к предупреждению и обнаружению отказов и восстановлению работоспособности объекта либо путем проведения ремонта, либо путем замены отказавших элементов.
3. Долговечность - свойство объекта сохранять работоспособность до наступления предельного состояния, то есть наступления такого состояния, когда он должен быть направлен в ремонт, либо изъят из эксплуатации.
4. Сохраняемость - свойство объекта сохранять работоспособность в течение (и после) его хранения и (или) транспортирования.
Перечисленные единичные свойства являются приемлемыми практически для всех объектов.
Однако для АСОИУ, как и для ряда других классов информационных систем, перечисленных свойств для характеристики надежности оказывается недостаточно. В практике создания и эксплуатации таких систем находят применение дополнительные два единичных свойства надежности:
1. Живучесть - свойство объекта сохранять работоспособность (полностью или частично) в условиях неблагоприятных воздействий, не предусмотренных нормальными условиями эксплуатации.
2. Достоверность информации, выдаваемой объектом. Это относится к сбоям и ошибкам, искажающим информацию.
При введении в техническую документацию тех или других показателей надежности необходимо исключать лишние, ненужные для описания комплексного показателя надежности, а также те, которые нельзя измерить или которые не имеют определенного ясного и понятного физического смысла.
С другой стороны, необходимо, чтобы набор единичных свойств надежности системы был достаточным для описания и оценки ее надежности.
При исследовании надежности сложных систем возникает задача выявления причин, приводящих к проявлению той или иной стороны надежности. Без знания этих причин нельзя составить и реализовать программу обеспечения надежности (ПОН) системы на этапах ее разработки и эксплуатации. Это приводит к необходимости выделения следующих видов надежности:
1. Аппаратная надежность - надежность комплекса технических средств (КТС).
2. Программная надежность - надежность программного обеспечения (ПО) системы.
3. Функциональная надежность - надежность выполнения отдельных функций, возлагаемых на систему, персоналом системы во взаимодействии с КТС и ПО.
4. Структурная надежность персонала системы - свойство персонала непрерывно сохранять работоспособность в течение некоторого времени в заданных условиях.
Аппаратная надежность КТС и структурная надежность персонала являются базовыми свойствами, без проявления которых принципиально невозможно функционирование системы.
Функциональная и программная надежности проявляются в процессе работы АСОИУ по обработке данных и выработке рекомендаций по управлению. Эти виды надежности относятся к прагматическим свойствам, проявляющимся в процессе эксплуатации системы по прямому назначению.
АСОИУ является многофункциональной системой, причем требования к надежности выполнения различных функций могут быть различными.
Например, для функции “расчет зарплаты” требуется высокая безошибочность и определенная точность, но не требуется жесткого ограничения времени выполнения (быстродействия), а АСОИУ, работающая в рамках реализации быстропротекающего технологического процесса, требует безошибочности, точности и быстродействия, так как в этом случае система выполняет оперативные функции обработки информации и управления.
Отдельного внимания заслуживает программная надежность (надежность ПО), что объясняется широким внедрением программно-управляемых объектов (программно-управляемые станки, вычислительные машины и системы ЭВМ, системы передачи данных и др.). Для этих объектов характерно органическое слияние КТС и программ, совместно реализующих операции обработки данных и управления. Без надежного ПО, даже при высокой надежности КТС и персонала, говорить о надежности системы беспредметно.
Перечисленные стороны и виды надежности не всегда рассматриваются все при задании требований по надежности к системе и ее частям. В каждом конкретном случае следует пользоваться теми из них, которые необходимы для характеристики надежности системы с учетом ее целевого назначения.
В основе понятия надежности любого объекта лежит понятие отказа.
Отказ объекта - событие, заключающееся в том, что объект либо полностью, либо частично теряет свойство работоспособности.
При полной потере работоспособности возникает полный отказ, а при неполной - частичный отказ. Понятия полного и частичного отказа каждый раз при решении задач оценки и обеспечения надежности систем должны быть четко определены, так как формулировка требований к надежности системы и ее частей и количественная оценка степени их реализации без указания признаков отказа не имеет смысла.
Отказы подразделяются в зависимости от природы их возникновения на внезапные и постепенные.
Разделять внезапные и постепенные отказы необходимо, так как закономерности, которым они подчиняются, и способы борьбы с ними различны.
Внезапный отказ возникает вне зависимости от предшествующих постепенных изменений свойств объекта, а постепенный - в результате длительного накопления повреждений, например, для технических средств - вследствие износа и старения материалов, для персонала - вследствие утомления. Для уменьшения числа внезапных отказов целесообразна их предварительная тренировка и приработка с целью выявления скрытых дефектов производства, а также введение защиты от неблагоприятных воздействий помех, перегрузок, вибраций и др. Для уменьшения числа постепенных отказов КТС следует организовать своевременную замену сменных блоков, выработавших технический ресурс, а для уменьшения постепенных отказов персонала - организация правильного режима труда и отдыха, сменности.
Отказ может быть кратковременным самоустраняющимся - сбоем. Характерным признаком сбоя является восстановление работоспособности без ремонтных (для техники) или восстановительных (для персонала и программного обеспечения) мероприятий. Причиной сбоя технических средств может быть их кратковременный отказ, либо кратковременно действующая помеха, для ПО - сбой в реализации программы, для оператора - ошибка, приводящая к нарушению в выполнении предписанного алгоритма деятельности. В общем случае возникновение сбоев приводит к снижению быстродействия системы, а в определенных условиях, когда факт сбоя своевременно не обнаруживается в процессе функционирования, он может привести к таким искажениям в обработке информации, которые затем вызовут отказ при выполнении системой заданной функции.
Все устойчивые отказы в АСОИУ целесообразно подразделить на следующие три класса:
1. Аппаратные - события, при которых какие-либо технические средства системы утрачивают работоспособность и для их восстановления требуется проведение ремонтных работ или замена отказавших элементов, блоков, приборов, устройств и др.
2. Программные - события, при которых программное обеспечение системы утрачивает работоспособность по причине несовершенства программ (несовершенство алгоритма, ошибки в кодировке, не выявленные в процессе отладки и тестирования, и т.д.).
3. Эргономические - события, при которых персонал системы утрачивает работоспособность по причине гибели, ранениях людей или их ошибочных действий при взаимодействии со средствами вычислительной техники или программным обеспечением.
В дальнейшем будут, в основном, рассматриваться только аппаратные отказы.