Знаменатель формулы коэффициента корреляции представляет среднее квадратическое отклонение переменных X и Y, которые могут быть определены следующим образом:
Следовательно, коэффициент корреляции может быть получен исходя из следующего выражения:
Все формулы равносильны, и любая из них может быть использована для расчета коэффициента корреляции.
Следует заметить, что коэффициент корреляции может принимать значения от -1 до +1. Знак коэффициента корреляции характеризует направление связи (прямая – знак «+»), (обратная – знак «-»), а абсолютная его величина характеризует тесноту связи. В экономических исследованиях при значении коэффициента корреляции свыше 0,7 связь считается тесной, а ниже 0,3 – слабой.
В нашем примере по данным табл. 14 коэффициенты парной корреляции между себестоимостью молока и факторами, влияющими на нее, будут следующие:
Результаты показывают, что связь себестоимости молока с данными факторами тесная. С уровнем кормления и продуктивностью – обратная, а с яловостью – прямая, т. е. с увеличением процента яловых коров в стаде себестоимость молока возрастает, а с увеличением расхода кормов на корову и ростом продуктивности коров себестоимость молока снижается.
Если мы имеем дело не с линейной функцией, а с криволинейной, то в этом случае следует говорить не о коэффициенте корреляции, а о корреляционном отношении, которое характеризует степень приближения уравнения регрессии к наблюдаемым значениям. Корреляционное отношение представляет собой корень квадратный из отношения объясненной дисперсии к общей. Объясненная дисперсия чаще определяется как разность между общей дисперсией и необъясненной.
Общая дисперсия равна сумме квадратов отклонений индивидуальных значений от средней величины:
Объясненная дисперсия характеризуется суммой квадратов отклонений расчетных значений по уравнению регрессии от средней величины:
Необъясненная дисперсия – это сумма квадратов отклонений индивидуальных значений от расчетных по уравнению регрессии соответствующих величин:
По правилу сложения дисперсий можно записать:
По аналогии с изложенным корреляционное отношение может быть выражено следующими формулами:
Подчеркнем, что, в отличие от коэффициента корреляции, корреляционное отношение изменяется в пределах от 0 до 1, т. е. всегда положительная величина, и в данном случае направления связи определяются коэффициентом регрессии.
Однако коэффициент корреляции применим только в случае линейной связи, а корреляционное отношение может быть вычислено при любой связи. Кроме того, корреляционное отношение дает возможность нагляднее представить содержание показателя тесноты связи.
Если необъясненная дисперсия
будет равна нулю, то это значит, что все фактические данные должны лежать на линии регрессии, и это будет характеризовать функциональную взаимосвязь. В таком случае корреляционное отношение будет равно единице. Если необъясненная дисперсия будет равна общей дисперсии:
то это будет свидетельствовать об отсутствии связи.
Подкоренное выражение корреляционного отношения и квадрат коэффициента корреляции называют коэффициентом детерминации, характеризующей долю вариации результативного признака, вызванной вариацией включенных в анализ факторов.
Представляет собой интерес расчет коэффициента корреляции между качественными признаками, выражающий наличие признака или его отсутствие.
Если обозначить наличие признака через «1», а его отсутствие – через «0», то получим:
где m>X – количество наблюдений признака X в выборке n.
где m>Y – количество наблюдений признака Y в выборке n.