S>2 = СУММА (Х>i – X̅)> 2 / (n – 1) (4.2)

где S>2 – выборочная дисперсия;

n – количество измерений;

X – отдельные значения;

X̅— среднее арифметическое по выборке.

Дисперсия – это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и, чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, мы просто рассчитываем среднюю арифметическую. Однако в чистом виде, как, например, средняя арифметическая, или индекс, дисперсия не используется. Это скорее вспомогательный и промежуточный показатель, который необходим для других видов статистического анализа. У нее нет даже единицы измерения. Чтобы использовать дисперсию в более приземленных целей, из нее извлекают квадратный корень, получается среднеквадратичное отклонение (СКО или S), иногда его называют стандартное отклонение.

Рис. 4.5. Пример выборки с коэффициентом вариации 45%


Среднеквадратичное отклонение вычисляется по формуле:

S = √ (СУММА (Х>i – X̅)> 2 / (n – 1)) (4.3)

где √ – корень квадратнный из суммы;

Х >i – результат i-го измерения из n выполненных;

n – количество измерений;

X̅ – среднее арифметическое значение.

Среднее арифметическое значение вычисляется по формуле:

X̅ = СУММА Х >i / n (4.4)

где Х >i – сумма результатов измерений с 1-го до n-ного;

n – количество измерений.

Математически, случайная погрешность может быть выражена не только величиной среднеквадратичного отклонения, но и коэффициентом вариации (CV). Среднее квадратичное отклонение дает абсолютную оценку меры разброса. Поэтому, чтобы понять, насколько разброс велик относительно самих значений (т.е. независимо от их масштаба), требуется относительный показатель – коэффициент вариации.

Коэффициент вариации – это стандартное отклонение, выраженное в процентах от среднего значения.

CV = S 100% / X̅ (4.5)

где X̅ – среднее арифметическое значение;

S – среднеквадратичное отклонение.



Рис. 4.6. Пример выборки с коэффициентом вариации 24%


Этот показатель вариации прекрасен тем, что и меру рассеяния учитывает, и единиц измерения не имеет, то есть совершенно не связан с масштабом анализируемых данных.

Исходя из этого факта, коэффициенты вариации можно сравнивать между собой и тем самым сопоставлять относительную меру рассеяния данных, независимо от их масштаба.

В статистике принято считать, что, если значение коэффициента вариации менее 30%, то совокупность данных является однородной, если более 30%, то – неоднородной. Что это означает?

Рассмотрим пример выборки с коэффициентом вариации 45% (рис. 4.5).

На графике видно, что диапазон разброса до плюс/минус 80, совокупность результатов анализа неоднородна.

Рассмотрим пример выборки с коэффициентом вариации 24% (рис.4.6).



При сравнении графиков видны отличия однородных данных от неоднородных. На втором графике – данные однородны со значением коэффициента вариации 24%, на первом – неоднородны со значением вариации 45%. Чем более однородны данные, тем ближе они находятся к среднему значению. Чем менее однородны, тем больше рассеяны и находятся дальше друг от друга и от своей средней. Если показатель вариации составляет примерно 30% и меньше, то статистическая совокупность считается однородной. Это означает, что большинство показателей находится недалеко от