Вы можете открыть актуальную версию документа прямо сейчас.
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Приложение А
(справочное)
Пример
оценки надежности сети Е2Е
А.1 Общие положения
Целью оценки надежности сети Е2Е является определение пути выполнения услуг сети в зависимости от ее надежности. Результатом оценки является показатель готовности или общая продолжительность неработоспособного состояния Е2Е-соединений за год. Метод SLB (балансировка нагрузки на сервер) приведен для демонстрации методов, используемых для обеспечения решений в области надежности при анализе путей выполнения услуг сети.
А.2 Описание топологии сети и путей выполнения услуг сети Е2Е
Пути выполнения услуг сети определяет топология сети. Топология сети учитывает следующее:
- сценарии выполнения услуг и требования к голосовым, числовым видеоданным или другим услугам сети;
- критичность предоставления услуги;
- соответствующие узлы и соединения для установления основного пути выполнения услуги Е2Е;
- резервные пути услуг на случай отказа основного пути.
На рисунке А.1 показан пример типичной топологии сети, в которой указаны соответствующие узлы и соединения Е2Е, а также их взаимосвязи в топологической конфигурации. На схеме указаны следующие обозначения узлов сети: А, I, K - переключатели (коммутаторы) обмена; В, С, D, Е - маршрутизаторы; F, G, Н, J - центры обработки данных, в которых хранятся соответствующие данные регистрации для доступа пользователя к данным и его аутентификации для облегчения соединений Е2Е. Соединения сети располагаются между узлами и устанавливают связи между ними. Результирующий путь выполнения услуги Е2Е должен установить связь А с J, инициированную конечным пользователем в А.
Рисунок А.1 - Пример типичной топологии сети Е2Е
Сценарий выполнения услуги можно объяснить следующей последовательностью действий:
- конечный пользователь использует доступ к А, чтобы установить связь с J;
- основной путь услуги, показанный сплошной линией "__", следует по узлам и соединениям A-B-D-F-I-H-I-J
для установления искомой связи с J;
- когда выполнение услуги достигает узла I, он требует аутентификации Н, чтобы разрешить продолжение выполнения услуги, представляя цикл I-H-I, уникальный для информационных потоков в коммуникационных технологиях;
- если в Н разрешение предоставлено, выполнение услуги продолжается от I к J для завершения соединения Е2Е. Следует отметить, что Н является критическим узлом, требующим высокой безотказности работы оборудования.
Из набора информации, предоставленной на данный момент, резервные пути услуги, показанные пунктирными линиями "--", могут быть установлены на основе сведений об узле и отказах соединений, обозначенных знаком "X" в топологической конфигурации. При установлении путей услуг сети Е2Е приходится иметь дело с унаследованными проблемами, когда существующие сети взаимодействуют с новыми сетями для завершения подключения Е2Е. Символ в виде стрелки "--->" используют только тогда, когда SLB слишком длинные и подключаются к новому соединению SLB для завершения построения пути услуги сети Е2Е.
А.3 Построение пути услуги сети Е2Е
Построение пути услуги сети Е2Е начинают с основных и резервных путей услуги и строят с помощью схем SLB, как показано в перечислениях а) - k),
а) Основной путь услуги
b) Резервный путь услуги при отказе соединения между узлами А и В
с) Резервный путь услуги при отказе узла В
d) Резервный путь услуги при отказе соединения между узлами В и D
е) Резервный путь услуги при отказе узла D
f) Резервный путь услуги при отказе соединения между узлами D и F
g) Резервный путь услуги при отказе узла F
h) Резервный путь услуги при отказе узла I
Из данного набора схем SLB можно определить показатели готовности или общую продолжительность неработоспособного состояния за год путей услуг сети Е2Е с использованием стандартных математических процедур и экспериментальных данных, установленных или оцененных для каждого узла и соединения в соответствии с топологией сети Е2Е. Высокая эксплуатационная готовность услуг сети Е2Е означает, что основной путь услуги доступен для эксплуатации, все резервные пути услуги также доступны по запросу, и переключение пути при необходимости должно быть успешным.
Каждый путь услуги от А до Н представляет собой простую последовательную модель RBD, позволяющую определить показатели готовности пути от А до Н. Готовность пути услуги Е2Е определяет комбинация готовности основного пути и резервных путей.
Коэффициент готовности пути услуги Е2Е А Е2Е может быть определен по вкладу продолжительности неработоспособного состояния следующим образом:
,
(А.1)
где DT E2E - продолжительность неработоспособного состояния пути услуги Е2Е мин/год, выполняемая по формуле
,
(А.2)
где f i - частота отказов i-го узла/соединения на основном пути (раз/год);
r i - коэффициент восстановления после отказа сети i-го узла/соединения основного пути;
dt i - продолжительность неработоспособного состояния i-го узла/соединения основного пути при отказе, когда услуга успешно выполнена;
MTTR i - среднее время восстановления i-го узла/соединения основного пути, когда услуга не выполнена.
В топологии сети иногда встречается топологическая конфигурация с маршрутизацией через всю взаимодействующую сеть, которая уже существует в эксплуатации. Метод SLB может включать такую взаимодействующую сеть для моделирования пути услуги сети Е2Е. Для этого взаимодействующую сеть представляют в виде "облака" с символом , включенным в путь услуги SLB. "Облако" рассматривают как узел сети в топологической конфигурации. Например, если маршрутизатору С необходимо установить связь через транспортную сеть, чтобы достичь маршрутизатора Е, соответствующие резервные пути услуги для с), d) и е) могут быть представлены соответствующими схемами SLB, указанными в i), j) и k),
i) Резервный путь услуги через "облако" при отказе узла В
j) Резервный путь услуги через "облако" при отказе соединения между узлами В и D
k) Резервный путь услуги через "облако" при отказе узла D
Метод SLB имеет следующие ключевые особенности при применении:
- SLB разработан специально для моделирования сетей связи;
- SLB используется для идентификации и отслеживания критических путей услуги Е2Е для дальнейшего анализа;
- SLB учитывает поток услуг, а также топологию сети;
- SLB включает ситуацию наличия обратного контура при моделировании топологической конфигурации сети, уникальной для информационных потоков в коммуникационных технологиях;
- SLB работает главным образом с единичными отказами; наличие нескольких отказов на путях сети редко бывает, но может возникать, например, при перегрузке и нарушении продвижения, что требует особого рассмотрения в каждом конкретном случае;
- SLB позволяет проведение дальнейших исследований чувствительности, таких как задержка пакетов, джиттер, потери и восстановление в реальном и нереальном времени, для облегчения планирования и выбора стратегий защиты услуг сети;
- SLB представляет собой логическую схему простого построения путей выполнения услуг Е2Е;
- SLB облегчает разделение сети для построения соответствующих путей выполнения услуг сети Е2Е, задействованных в существующих сетях, взаимодействующих с новыми сетями;
- База данных об отказах SLB использует результаты оценки или экспериментальные данные о работе услуг сети Е2Е для поддержки оценки продолжительности неработоспособного состояния сети;
- SLB можно компьютеризировать для облегчения итеративного анализа отказов сети Е2Е и оценки их влияния на работу сети.
А.4 Анализ путей выполнения услуг сети Е2Е
Предпосылкой анализа пути выполнения услуги Е2Е является определение места отказа и типа отказа в рассматриваемом сетевом пути. Типичные отказы сети включают:
- отказы оборудования;
- неполадки в ОАМР;
- неисправность оборудования и перебои в подаче электроэнергии;
- процедурные ошибки;
- перегрузка трафика;
- аварии и экологические инциденты;
- проникновение в систему безопасности и злонамеренные атаки на сеть.
Расположение отказов узлов и соединений сети может существовать на любом уровне сети, как описано в эталонной модели OSI [15]. Ниже приведены примеры некоторых возможных симптомов отказа сети:
- прикладной уровень: отказ при передаче файлов по электронной почте;
- уровень представления: отказ в шифровании и преобразовании данных;
- уровень сеанса: отказ поддержки порядка запуска/остановки связи;
- транспортный уровень: отказ доставки сообщения;
- уровень сети: отказ маршрутизации данных;
- уровень линии данных: отказ передачи фреймов от узла к узлу;
- физический уровень: отказ оборудования в узле или кабельной линии сети.
По этим симптомам можно отследить ответственные узел или соединение сети для определения основных причин их отказа. Соответствующие последствия отказа также могут быть установлены по результатам испытаний сети или на основании наблюдений в условиях эксплуатации, касающихся степени и критичности воздействия отказа для конечных пользователей сети и предоставления соответствующих функций услуг сети. Эти данные наиболее ценны для сбора и хранения в базе данных для текущей и будущей оценки показателей ОАМР.
Например, отказ сети, вызывающий перегрузку сообщений и частые прерывания выполнения услуг сети Е2Е, связан с совместимостью версий программного протокола, используемого на уровне приложений. После определения причины отказа протокол обновляют до последней версии, тем самым восстанавливая нормальное выполнение услуг сети Е2Е.
Общий процесс анализа называют NFMECA.
Соответствующую информацию об отказах фиксируют в базе данных FRACAS в качестве общего хранилища данных о режимах отказов и их последствиях. База данных FRACAS может быть эффективно использована в качестве источника опытных данных для диагностики отказов сети и аналогичных симптомов отказа для ускорения соответствующих корректирующих действий. База данных FRACAS - ценный инструмент поддержки прогнозирования показателей готовности сети и продолжительности неработоспособного состояния сети. База данных FRACAS должна быть связана с системой управления неисправностями сети, чтобы облегчить общее хранение данных и обмен информацией, где это применимо.
А.5 Оценка путей выполнения услуг сети Е2Е
Знания, полученные в результате NFMECA, могут быть использованы для принятия решений и оценки рисков проекта, таких как:
a) рекомендации по перепроектированию целевого пути выполнения услуг сети Е2Е для улучшения проекта сети и обеспечения надежности;
b) разработка тестовых случаев для NFIT при проверке возможных последствий идентифицированного отказа путем инициирования тестов введения неисправности в соответствующий путь услуги сети Е2Е. Для создания тестовых случаев используют данные NFMECA и другую соответствующую информацию.
Процесс реализации проекта целевого пути услуг сети Е2Е в соответствии с а) представляет собой процесс перепроектирования, который строго следует процессу жизненного цикла проектирования/разработки и изготовления/интеграции. Соответствующие стадии жизненного цикла сети описаны в [1].
Оценка целевого пути услуг сети Е2Е в соответствии с b) предназначена для разработки соответствующих тестовых случаев для применения NFIT. NFIT выполняет тесты для моделирования реальных условий эксплуатации пути услуг сети Е2Е посредством введения неисправности и изучения результатов тестирования. Цель состоит в определении степени экспозиции риска при проведении перепроектирования. NFIT - это попытка проверки и подтверждения неопределенности возможного результата до выполнения фактических действий по перепроектированию пути услуг сети Е2Е. В зависимости от графика реализации проекта и бюджетных ограничений деятельность NFIT в соответствии с b) обеспечивает дополнительную уверенность в процессе перепроектирования в соответствии с а) и предоставляет тестовую информацию, помогающую в принятии решений при проектировании. Адаптация проекта и компромиссы полезны при принятии решений.
Тестовый случай представляет собой набор входов условий выполнения и ожидаемых результатов, разработанных для конкретного объекта тестирования. В этом случае верификация целевого перепроектирования пути услуг сети Е2Е заключается в достижении работы сети при обеспечении надежности услуг. Введение неисправности является методом верификации, при котором преднамеренную неисправность вводят в целевой путь выполнения услуг сети Е2Е для определения ожидаемых результатов тестирования. Результат теста представляет собой объективные свидетельства в поддержку решения о перепроектировании.
NFIT также обеспечивает средства оценки эффективности процесса тестирования, результирующего охвата неисправностей сети, коэффициента готовности пути услуг сети и влияния на надежность работы сети.
В рамках процесса, оценки путей выполнения услуг сети Е2Е, могут быть определены следующие данные:
a) продолжительность неработоспособного состояния услуг сети:
- сумма продолжительности неработоспособного состояния, вызванного отказами каждого узла сети;
- сумма продолжительностей неработоспособного состояния, вызванных отказами каждого соединения сети;
b) коэффициент готовности услуг сети;
c) виды отказов:
- узел сети: отключение услуги, частичное отключение услуги, прерывистое обслуживание, мгновенное отключение услуги, деградация услуги;
- соединение сети: обрыв соединения.
d) информация о параметрах сети:
Параметр сети |
Источник |
- продолжительность неработоспособного состояния услуг сети за год (мин/год) |
рассчитанный результат |
- количество узлов в сети |
топология сети |
- количество соединений в сети |
топология сети |
- частота отказов i-го узла |
статистика FRACAS |
- частота отказов на линии i-го соединения |
бизнес-статистика |
- продолжительность отключения i-го узла услуги (минуты) |
результаты NFIT |
- продолжительность отключения соединения услуги (минут) |
результаты NFIT |
- интенсивность восстановлений сети |
результаты NFIT |
- среднее время восстановления i-го узла |
статистика FRACAS |
- среднее время восстановления i-го соединения |
статистика оператора |
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.