Второй вариант решения вышеназванной задачи возможен посредством использования дисперсионного анализа (ANOVA, MANOVA), который позволяет определить статистическую достоверность влияния одной (нескольких) переменной на другую (другие) переменную6. Но следует всегда помнить, что для проведения дисперсионного анализа необходимо выполнение целого ряда требований, без наличия которых мы получим не совсем валидные выводы. В частности, к этим требованиям относятся следующие: количество разрядов фактора (независимой переменной) должно быть не менее трех, распределение результативного признака по каждой градации фактора не должно отличаться от нормального, должно соблюдаться условие равенства дисперсий результативного признака (зависимой переменной) по каждому разряду фактора. Когда эти требования невыполнимы и зависимая переменная неочевидна, так как переменные находятся в сложных связях, решить задачу о влиянии переменных друг на друга с использованием дисперсионного анализа (ANOVA, MANOVA) невозможно.

Третий вариант решения вышеназванной задачи, который мы представляем в данном пособии, – метод Чамберса (метод «корреспондирующей регрессии»)7. Чамберс наблюдал, что каузальность может выводиться из соответствия дисперсий в зависимых переменных. Используя имитацию, он продемонстрировал, что высокие значения зависимой переменной вытекают из высоких значений независимых переменных, низкие значения – из низких значений, однако умеренные значения зависимой переменной могут вытекать из различных уровней независимых переменных, поскольку высокие и низкие значения независимых переменных нейтрализуют друг друга. Он также показал, что ограничение независимых переменных умеренными значениями в целом приводило к умеренным значениям зависимой переменной. Основываясь на этих наблюдениях, он показал, что дисперсия зависимых переменных, корреспондирующая со случаями с умеренными оценками независимых переменных, ниже, чем дисперсия независимых переменных, корреспондирующая со случаями с умеренными оценками зависимых переменных. Эта асимметрия используется для определения каузальной направленности.

Впоследствии Чамберс предложил способ определения каузальности на основе корреспондирующих регрессий (corresponding regressions). Возьмем двумерную регрессию y на х, где существует неопределенность в отношении того, не может ли подобная каузальная направленность оказаться противоположной. В корреспондирующих регрессиях y регрессируется на х, и абсолютные отклонения (прогнозируемые минус действительные значения y – остатки (см. параграфы 4.1–4.3)) рассматриваются как измерение крайности ошибок предсказания. Затем берутся отклонения значений х от среднего значения х для получения измерения крайности значений предиктора. Эти два столбца отклонений коррелируются, давая корреляцию отклонения для y, именуемую rde(y). Такая корреляция отклонения будет негативной, поскольку, когда значения предиктора оказываются крайними, ошибки должны быть меньше, так как высокие значения предиктора приводят к высоким значениям зависимой переменной, а низкие значения – к низким значениям. Далее та же процедура повторяется в отношении регрессии x на y, давая rde(x).

Когда истинно независимая переменная служит предиктором, должна наблюдаться более высокая корреляция, чем когда истинно зависимая переменная служит предиктором.

То есть значение rde выше, когда истинно независимая переменная служит предиктором. Это происходит по причине того, что умеренные оценки предиктора (измеряемые низкой крайностью значений предиктора) должны ассоциироваться с умеренными оценками зависимой переменной (измеряемыми крайностью ошибок) лишь в том случае, когда истинная независимая переменная используется как предиктор истинной зависимой переменной: