Управление надежностью и живучестью компьютерных сетей ОНАПТ / ОНТУ Кафедра компьютерной инженерии Ст. преп. Ненов Алексей Леонидович 7 лекций 8 лабораторных занятий Экзамен Основные понятия теории надежности Надежность — свойство объекта сохранять во времени в установленных пределах значения всех параметров, характеризующих способность объекта выполнять требуемые функции в заданных режимах и условиях применения, технического обслуживания, ремонтов, хранения и транспортировки. Надежность технического объекта = = Безотказность + Ремонтопригодность + Долговечность + Сохраняемость Безотказность — способность работать безотказно. Ремонтопригодность — способность ремонтироваться. Долговечность — способность работать в течение всего срока службы. Сохраняемость — способность работать после хранения или транспортировки. Исправность — соответствие всем техническим нормам. Повреждение (дефект) — нарушение исправности. Работоспособность — способность выполнять свои функции. Отказ — нарушение работоспособности. Схема состояний и событий объектов 1 – повреждение; 2 – отказ; 3 – переход объекта в предельное состояние; 4 – восстановление/ремонт; 5 – капитальный ремонт Абстрактный процесс функционирования системы Периоды работоспособности Состояние системы в момент времени t Состояние работоспособности Периоды отказа Состояние отказа Состояние системы из n элементов: Дискретное пространство состояний системы из двух элементов: Пространство состояний системы Состояние отказа Последовательное и параллельное соединение элементов в смысле надежности Виды отказов Постепенный и внезапный отказы Показатели надежности Вероятность безотказной работы (ВБР) Вероятность безотказной работы P – вероятность того, что не возникнет отказа в пределах заданной наработки или на заданном интервале времени. Вероятность отказа Q – обратная величина. Статистическая оценка ВБР: Число объектов в начале испытаний Число отказавших объектов Число работающих объектов Наработка до отказа Наработка Т – продолжительность или объём работы объекта. Измеряется в часах, километрах пробега, циклах включения-выключения и др. Наработка до отказа – наработка объекта от начала его эксплуатации (или от момента его восстановления) до отказа. (С 2015 г. характеризует безотказность как невосстанавливаемых, так и восстанавливаемых объектов). Средняя наработка до отказа — математическое ожидание наработки объекта до отказа (средний интервал безотказной работы – постфактум и/или вероятностный прогноз на будущее). i-я наработка число отказов (Для программных продуктов обычно подразумевается срок до перезапуска программы). Гамма-процентная наработка до отказа Гамма-процентная наработка до отказа — наработка до отказа, в течение которой отказ объекта не возникнет с вероятностью γ, выраженной в процентах. Интенсивность отказов Интенсивность отказов λ(t) — отношение числа отказавших объектов в единицу времени к среднему числу объектов, продолжающих исправно работать в данный интервал времени. число отказавших объектов в интервале времени Δt ( t ± (Δt / 2) ) среднее число исправно работающих объектов в интервале Δt приработка старение нормальная эксплуатация Экспоненциальная модель распределения времени до отказа Коэффициент готовности Кг – вероятность того, что объект окажется в работоспособном состоянии в произвольный момент времени (кроме планируемых периодов, в течение которых применение объекта по назначению не предусматривается). Комплексный показатель – учитывает как безотказность, так и ремонтопригодность, долговечность и сохраняемость изделия. суммарное время исправной работы суммарное время вынужденного простоя Коэффициент оперативной готовности: Коэффициент простоя: Классификация факторов, влияющих на надежность Классификация факторов, влияющих на надежность Виды расчетов надежности Последовательность расчета надежности Расчет параллельных и последовательных структур надежности Последовательная структура: из n элементов: Параллельная структура из 3 элементов: из n элементов с интенсивностью отказов λ0: Расчет надежности локальной сети Пути и сечения обобщенной двухполюсной сети передачи данных Структурная надежность двухполюсной сети Надежность пути между узлами i и j – вероятность исправного состояния всех его рѐбер: Вероятность исправности хотя бы одного ребра в сечении Граничные оценки (ЭП) надежности связи между узлами i и j: НГЭП Точное значение надежности связи между узлами i и j: Операция поглощения : ВГЭП Преобразования сложных структур. Преобразование «треугольник – звезда» Преобразования сложных структур. Разложение по базовому элементу Логико-вероятностный расчет надежности. Базовые операции Логико-вероятностный расчет надежности. Правила преобразований сложных выражений Замена логических операций на арифметические: Пример логико-вероятностного расчета мостиковой структуры Логическая функция работоспособности: Минимальная форма логической функции работоспособности: Разложение по базовому элементу 5 и приведение Fл к бесповторному виду: Арифметизация Fл: Замена событий вероятностями: Резервирование Резервирование — способ повышения надежности изделия включением резервных (избыточных) элементов (аппаратное, элементное резервирование), либо других резервных средств, обеспечивающих выполнение заданной функции. Раздельное резервирование с постоянным включением элементов: Раздельное резервирование с замещением отказавшего элемента: Общее резервирование: Мажоритарное резервирование: Другие виды резервирования Функциональное резервирование — резервирование, при котором заданная функция может выполняться различными способами и техническими средствами. Временное резервирование — планирование работы изделия, при котором создается резерв рабочего времени для выполнения заданных функций. Информационное резервирование (избыточность) — введение избыточных информационных символов при передаче, обработке и отображении информации. Контроль в процессе эксплуатации Расчет надежности с использованием графа состояний Матрица вероятностей переходов: вероятность сохранения состояния P1 Система уравнений, определяющая вероятности состояний: Расчет надежности с использованием графа состояний Приближение: Тогда система уравнений вероятностей состояний примет вид: Учитывая, что: можем привести систему уравнений вероятностей состояний к виду: Решение системы уравнений вероятностей состояний Повышение надежности сети добавлением перемычек между путями Надежность сети с коммутацией пакетов В качестве характеристики потерь пакетов может использоваться доля потерянных пакетов (L), равная отношению количества потерянных пакетов (NL) к общему количеству переданных пакетов (N): Либо аналогичная характеристика, оперирующая объёмами данных. Доступность (availability) – доля времени, в течение которого система или служба находится в работоспособном состоянии. Отказоустойчивость (fault tolerance) – способность системы сохранять работоспособность при отказе отдельных её элементов; часто при этом происходит снижение качества работы (деградация). Алгоритм покрывающего (остовного) дерева STA 1) Определение корневого коммутатора. 2) Выбор корневого порта для каждого некорневого коммутатора. 3) Выбор назначенных коммутаторов и портов для каждого сегмента. 4) Блокирование не назначенных и некорневых портов коммутаторов. Сегмент — связная часть сети, не содержащая коммутаторов, маршрутизаторов и мостов (устройств канального уровня). Пример работы протокола STP (алгоритма STA) на сети с двухточечными сегментами Пример сети из 8 коммутаторов и 14 двухточечных сегментов. Результат работы протокола STP Активная топология, найденная по протоколу STP. Пример работы STP на сети с разделяемыми сегментами. Этап 1 Исходная сеть. Выбран корневой коммутатор. Пример работы STP на сети с разделяемыми сегментами. Этапы 2 и 3 Выбраны корневые порты коммутаторов. Выбраны назначенные порты сегментов. Пример работы STP на сети с разделяемыми сегментами. Этап 4 Не корневые и не назначенные порты блокируются. После ошибки подключения дерево перестраивается.