Основным инструментом статистики является так называемая гистограмма распределения оцениваемой величины. В данном случае оцениваемой величиной является задержка доставки пакета.
Будем считать, что нам удалось измерить задержку доставки каждого пакета и сохранить полученные результаты. Для того чтобы получить гистограмму распределения, мы должны разбить весь диапазон возможных задержек на несколько интервалов и подсчитать, сколько пакетов из нашей последовательности измерений попало в каждый интервал. В результате мы получим гистограмму, показанную на рис. 6.3. Здесь диапазон 25-75 мс, в который попали все значения задержек, разбит на шесть интервалов (сеть вносит фиксированную задержку в 25 мс, связанную с распространением сигнала и буферизацией пакета). Значит, мы можем использовать в качестве характеристики производительности нашей сети шесть чисел: nl, п2, пЗ, п4, п5 и пб. Это уже более компактная форма представления последовательности задержек. Но нужно соблюдать баланс между желанием сократить до минимума количество интервалов и информативностью полученных характеристик.
|
|
Гистограмма задержек дает хорошее представление о производительности сети. По ней можно судить, какие уровни задержек более вероятны, а какие менее. Чем больше период времени, в течение которого собираются данные для построения гистограммы, тем с более высокой степенью вероятности можно предсказать поведение сети в будущем. Например, пользуясь гистограммой на рис. 6.3, можно сказать, что с вероятностью 0,6 задержка пакета не превысит 50 мс. Для нахождения такой оценки мы сложили общее количество пакетов, задержки которых попали во все интервалы, меньшие 50 мс, и разделили эту величину на общее количество пакетов. Другими словами, мы нашли долю пакетов, задержки которых не превышают 50 мс.
При увеличении количества интервалов и времени наблюдения мы в пределе получаем непрерывную функцию, которая называется плотностью распределения задержки доставки пакета (показана пунктиром). В соответствии с теорией, вероятность того, что значение случайной величины окажется в определенном диапазоне, равна интегралу плотности распределения случайной величины от
нижней до верхней границ данного диапазона. Таким образом может быть вычислена вероятностное значение задержки пакета.
^ Число пакетов
п2
ПЗ
Плотность распределения /
п4
п5
пб
Задержка, мс
Фиксированная задержка
Рис. 6.3.
Гистограмма распределения задержек
Только что мы впервые столкнулись с тем, что большое количество сетевых характеристик являются статистическими (вероятностными). Мы не можем со стопроцентной уверенностью сказать, что характеристика имеет некоторое конкретное значение. Мы можем говорить об этом только с какой-то вероятностью, потому что процессы перемещения данных в сети с коммутацией пакетов являются случайными процессами по своей сути.
|
|
Определим еще несколько часто используемых статистических характеристик задержки пакета.
Среднее значение задержки (D) вычисляется как сумма всех задержек dj, деленная на количество всех измерений N:
п1 |
D = ][]—. ^ N
Джиттер[15] (J) представляет собой среднее отклонение каждой отдельной задержки от среднего значения задержки:
т_ il(d, -D)2
J i N-i ■
Как среднее значение задержки, так и джиттер измеряются в секундах. Очевидно, что если все задержки d, равны между собой, то вариация отсутствует, что подтверждают приведенные формулы — в этом случае D = d{ и J = 0.
Коэффициент вариации — это безразмерная величина, которая равна отношению джиттера к среднему значению задержки:
CV=J/D.
Коэффициент вариации характеризует трафик без привязки к абсолютным значениям временной оси. Идеальный равномерный поток данных всегда будет обладать нулевым значением коэффициента вариации. Коэффициент вариации, равный 1, означает достаточно пульсирующий трафик, так как средние отклонения интервалов от некоторого среднего периода следования пакетов равны этому периоду.
Максимальная задержка — это величина, которую задержки пакетов не должны превосходить с заданной вероятностью. Мы недавно вычисляли такую величину по гистограмме задержек. Чтобы получить оценку, достаточно определенно говорящую о качестве работы сети, обычно задают высокую вероятность, например 0,95 или 0,99. Действительно, если пользователю скажут, что сеть будет обеспечивать уровень задержек в 100 мс с вероятностью 0,5, то это его не очень обрадует, так как он ничего не будет знать об уровне задержек половины своих пакетов.
Максимальная вариация задержки — максимальное значение, на которое отклонение задержки от среднего значения задержки не превосходит с некоторой вероятностью.
Время реакции сети является интегральной характеристикой производительности сети с точки зрения пользователя. Именно эту характеристику имеет в виду пользователь, когда говорит: «Сегодня сеть работает медленно». Время реакции определяется как интервал времени между возникновением запроса пользователя к какой-либо сетевой службе и получением ответа на этот запрос. Время реакции сети можно представить в виде нескольких слагаемых, например (рис. 6.4): время подготовки запросов на клиентском компьютере (t^cmi)* время передачи запросов между клиентом и сервером через сеть (tceTb), время обработки запросов на сервере (tcepBep), время передачи ответов от сервера клиенту через сеть (снова tCCTb) и время обработки получаемых от сервера ответов на клиентском компьютере (^ИС11т2).
Время реакции сети характеризует сеть в целом, в том числе качество работы аппаратного и программного обеспечения серверов. Для того чтобы отдельно оценить транспортные возможности сети, чаще используется другая характеристика — время оборота данных по сети.
Время оборота (Round Trip Time, RTT) — это «чистое» время транспортировки данных от узла отправителя до узла назначения и обратно без учета времени, затраченного узлом назначения на подготовку ответа:
RTT = 2 х tCCTb.
RTT является полезной характеристикой в том случае, когда значения времени передачи данных по сети в прямом и обратном направлениях отличаются друг от друга. Как и для односторонних задержек, значение RTT можно оценивать по его среднему и максимальному (с заданной вероятностью) значениям.
В зависимости от типа приложения клиент может использовать тот или иной набор характеристик задержек. Рассмотрим, например, работу приложения, воспроизводящего музыку через Интернет. Поскольку эта услуга не является интерактивной, она допускает значительные задержки передачи отдельных пакетов, например несколько минут. Однако пакеты должны приходить равномерно, то есть вариация задержки должна не превышать 100-150 мс, иначе качество воспроизведения музыки резко упадет. Поэтому в данном случае требования к сети должны включать ограничения на среднюю вариацию задержки или максимальное значение вариации задержки.
|
|