Chambers`D = rde(y) – rde(x)

Когда истинно независимая переменная является х, а истинно зависимая y, D будет негативным. То есть только если х является истинно независимой переменной, а y истинно зависимой, rde(y) будет более негативным, чем rde(x).

Проиллюстрируем этот способ на исходных данных, которые приведены в примере 1.1.

Только заметим, что часть необходимой информации для решения данного примера на этой стадии освоения регрессионного моделирования для читателя будет не совсем понятна, так как определение остатков в регрессионной модели приведено в нашем пособии ниже (согласно логике изложения материала), и поэтому мы рекомендуем вернуться к данному примеру после того, как читатель ознакомится со всем содержанием учебного пособия.

Пример 1.2. В студенческой группе было проведено исследование уровня агрессивности (тест-опросник Басса–Дарки) и уровня субъективного ощущения студентами своего одиночества (тест-опросник Д. Рассела, Л. Пепло, М. Фергюсона), в результате которого были получены данные, отраженные в табл. 1.2 (x – агрессивность, y – чувство одиночества).


Таблица 1.2

Данные исследования


Решение

1. Будем считать агрессивность независимой переменной, а чувство одиночества – зависимой. Исходные данные представлены в таблице:



2. Будем считать, что лучше всего аппроксимирует эмпирические данные линейная регрессионная модель. Определим параметры модели (используем SPSS).

ŷ = 1,61x + 8,1 + ε

3. Найдем отклонения эмпирических значений от теоретических (ошибку):



4. Найдем отклонения значений х от среднего значения по х:



5. Рассчитаем коэффициент линейной корреляции (условно не будем учитывать фактор объема выборки). Так как величина коэффициента корреляции не изменится, если значения переменных x и y уменьшать или увеличивать в а раз, вычесть или прибавить к значениям переменных x и y одно и то же число b8, чтобы избавиться от отрицательных значений переменных, прибавим 7 к значениям ошибки и 5 к значениям разницы x>эмпирич. и x>среднее:

rde(y)=0,006

6. Будем считать чувство одиночества независимой переменной, а агрессивность – зависимой. Исходные данные представлены в таблице:



7. Будем считать, что лучше всего аппроксимирует эмпирические данные линейная регрессионная модель. Определим параметры модели (используем SPSS).



8. Найдем отклонения эмпирических значений от теоретических (ошибку):



9. Найдем отклонения значений у от среднего значения по у:



10. Рассчитаем коэффициент линейной корреляции (условно не будем учитывать фактор объема выборки). Чтобы избавиться от отрицательных значений переменных, прибавим 2 к значениям ошибки и 11 к значениям разницы x>эмпирич. и x>среднее.

rde(х)=0,004

11. Общий вывод: сравним rde(y) и rde(х). По численным значениям rde(y) выше rde(х), и по формальным аспектам агрессивность статистически выше влияет на чувство одиночества, нежели наоборот, и есть смысл на статистическом уровне определить агрессивность как независимую переменную, а чувство одиночества – как зависимую. Но так же как при расчете коэффициентов детерминации

и
, по этим исходным данным разница между rde(y) и rde(х) составляет всего 0,002, и эта разница вполне может измениться при увеличении числа эмпирических замеров. В данной задаче лучше сделать такой вывод: статистический анализ не позволяет нам однозначно соотносить между собой агрессивность и чувство одиночества как зависимую и независимую переменные, а в гипотезе исследования отказаться от понятий «влияет» или «определяет».

Кроме этого, обращаем особое внимание на требования, которые предъявляются к характеру эмпирического распределения