1 Введение в диагностику компьютерных сетей
1.1 КС как объект диагностирования. Основные понятия и определения
 

1.1 КС как объект диагностирования. Основные понятия и определения

     В терминах стандарта технической диагностики цифровых устройств диагностирование [1,2] - определение технического состояния объекта диагностирования. Однако, применительно к КС данное определение необходимо расширить, поскольку при исправном техническом состоянии каждого из компонентов КС в отдельности может иметь место ситуация, когда общее качество работы КС оказывается неудовлетворительным с точки зрения пользователя или сетевых задач, решаемых в КС. Таким образом, необходимо ввести в рассмотрение ряд понятий и определений для компьютерной сети как объекта диагностирования (ОД), на которые мы будем опираться в течение данного учебного курса.

     Так, под диагностированием КС будет пониматься комплекс средств, методов и алгоритмов, направленных на обнаружение места и причины несоответствия состояния КС как ОД исправному, а также на предотвращение возникновения такого несоответствия.

     Исправное состояние [1,2] - состояние объекта, при котором он соответствует всем требованиям нормативно-технической и конструкторской документации. Применительно к КС как ОД к таким требованиям относятся: техническое задание заказчика, требования к качеству обслуживания пользователей Интернет и корпоративных сетей Quality of Service (QoS), установленные комитетом IETF, соглашения об уровне обслуживания Service Level Agreement (SLA), стандарты де-факто, сведения о пиковых значениях характеристик компонентов сети, полученные в результате выполнения упреждающей диагностики.

     Другими словами, состояние КС как ОД определяется: качеством работы сети. Качество работы сети с точки зрения пользователя определяется временем реакции прикладного ПО сервера на запрос клиента. В ситуации, когда имеет место физическая недоступность узла-сервера - время реакции стремится к бесконечности. Необходимо учитывать, что под термином «время реакции сети» в области диагностирования и оптимизации КС понимаются различные величины, характеризующиеся разными значениями:

     1) Интервал времени между возникновением запроса пользователя к какому-либо сетевому сервису на сервере и получением ответа на этот запрос. В этом случае проводится исследование всех компонентов тракта передачи данных, включая системные ресурсы конечных узлов. Как показали исследования, проведенные группой американских психологов, данный вид времени реакции не должен превышать 2 секунды. Если время реакции оказывается большим, то пользователи чувствуют себя некомфортно, быстро устают, часто делают ошибки, производительность труда становится низкой. Также по имеющемуся соглашению в промышленности, передача, выполняемая любым узлом в ответ на любой запрос должна занимать не более 100 мс. В случае глобальной сети - 200-250 мс для любого ответа на любой тип запроса узла.

     2) Интервал времени между отправлением кадра с сетевого адаптера узла-источника к сетевом адаптеру узла-приемника. В этом случае проводится исследование качества канала передачи данных. Здесь оптимальное значение времени реакции определяется временем, затрачиваемым на передачу кадра минимальной длины с учетом межкадрового интервала. Так, для протокола Ethernet 10 Мб/с это время будет составлять 67.2 мкс.

     Все прочие критерии, такие как число ошибок передачи данных, степень загруженности сетевых ресурсов, производительность оборудования, являются вторичными. Таким образом, под неудовлетворительной работой понимается постоянное или перемежающееся отсутствие доступа к разделяемым ресурсам сети, большое время реакции прикладного серверного ПО на запрос клиента.

     КС как объект диагностирования (ОД) определяется соотношением (1.1), связывающим критерий качества работы КС y с факторами, оказывающими на него влияние:

,     

(1.1)

где y - время реакции прикладного ПО сервера на запрос клиента; факторы, характеризующие компоненты КС как ОД и влияющие на значение критерия качества работы КС, представлены следующими множествами: - совокупность характеристик кабельной системы и другого пассивного оборудования, - совокупность характеристик активного сетевого оборудования (сетевые платы, концентраторы, коммутаторы, маршрутизаторы), - совокупность характеристик системных ресурсов сервера и рабочих станций, - совокупность конфигурационных и сетевых настроек сетевой операционной системы.

     Особенностью КС как ОД является то, что при исправном техническом состоянии каждого из сетевых компонентов в отдельности - может иметь место ситуация, когда работа сети в целом не отвечает требуемому уровню качества и, следовательно, КС с точки зрения пользователей и выполняемых в ней сетевых задач исправной не является. Это объясняется наличием ошибок на этапе проектирования и развертывания сети, несбалансированности нагрузки и сетевых компонентов, использования ПО с неэффективными алгоритмами реализации.

     Структурная схема КС как ОД может быть представлена в соответствии с компонентным подходом, где каждый из компонентов сети является совокупностью компонентов уровня L-1, каждый из которых, в свою очередь, представлен совокупностями компонентов уровня L-2 и т.д. Каждый из компонентов конечного (низшего) уровня является потенциальным носителем неисправности, то есть может оказаться причиной неудовлетворительного качества работы сети. Иерархическое упорядочение, характеризующее рассмотренный подход, позволяет получить наиболее полную модель неисправностей КС и, следовательно, повысить эффективность процедуры постановки диагноза.

     В качестве примера, демонстрирующего описанный выше подход, представлен фрагмент модели некоторой сети (рис. 1.1), состоящий из пяти взаимосвязанных компонентов: рабочей станции, коллизионного домена А, коммутатора, коллизионного домена В, сервера. Каждый коллизионный домен может представлять собой концентратор вместе с кабельной системой (как в домене А) или только полу/полнодуплексное соединение между рабочей станцией/сервером и коммутатором (как в домене В). На рисунке 1.2 приведено иерархическое упорядочение компонентов для представленного фрагмента сети.

          

     Рисунок 1.1 - Иерархический компонентный подход к представлению КС как ОД

          

          Рисунок 1.2 - Иерархическое упорядочение компонентов КС

     

      Д. Нессер [3] предлагает рассматривать КС как ОД на основе поуровневой верификации функционирования стеков сетевых протоколов, базирующейся на анализе характеристик и процессов, по которым следует судить о корректности работы данного стека или какого-либо из его уровней. Указанные характеристики и процессы могут быть как общие для всех существующих стеков протоколов (доля широковещательных передач, дубликатные адреса, перекрытие запросов с ответами, повторные передачи, последовательность открытия сеанса связи, механизмы сохранения соединения, механизмы рассылки сообщений, сообщения об ошибках в сети), так и присущие только конкретно заданному стеку (стек протоколов TCP/IP: все типы пакетов протокола ICMP, время жизни TCP-пакета, размер окна). Данный подход отличается высокой сложностью и значительными временными затратами и применяется, в основном, при тонкой оптимизации сети, когда качество работы сети является в целом удовлетворительным, дефекты, узкие места и другие факторы, снижающие скорость работы сети, отсутствуют, и ставится цель выявления оптимального сочетания параметров настройки сети.

     Тест [1,2] - вход-выходная последовательность, предназначенная для установления соответствия технического состояния объекта заданным техническим состояниям. В сети тест осуществляется сервисным оборудованием аппаратной либо программной реализации. К первому относится проверка кабеля кабельным сканером, тестером, мультиметром, терминатором на целостность либо идентификацию места и причины неисправности. Ко второму: команда ping - проверка целостности кабеля, исправности сетевого адаптера либо идентификация неисправности. Следует заметить, что тест может носить как активный, связанный с выполнением действий, влияющих на функционирование сети, например, проверка кабельной системы или стрессовое диагностирование, так и пассивный характер, осуществляемый путем наблюдения за сетью и сбора статистической информации без вмешательства в работу сети.

     Элементарная проверка (ЭП) - процедура, состоящая в подаче теста и наблюдении реакции на него сетевого компонента либо фактора, его характеризующего, выполняемая в целях выявления неисправности, влияющей на техническое состояние сети.

     Реакция - информация о техническом состоянии тестируемого компонента, получаемая при подаче на него теста и позволяющая сделать выводы о соответствии либо несоответствии объекта заданным техническим состояниям.

     Результат элементарной проверки - сравнение реакции с эталоном при подаче теста. Проверка является положительной, если реакция свидетельствует о соответствии технического состояния тестируемого компонента эталонному. Результат элементарной проверки отрицателен, если реакция свидетельствует о несоответствии технического состояния тестируемого компонента эталонному.

 
© 2010 ХНУРЭ, АПВТ, Бабич Анна Витальевна
Разработано с помощью LERSUS