Главная > Математика > Линейный регрессионный анализ
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

4.2. Множественный коэффициент корреляции

Пусть задана линейная модель и мы хотим установить, является ли регрессия с заданными регрессорами значимой. Иными словами, мы хотим проверить гипотезу Гипотеза имеет вид где матрица размера и ранга так что применима общая теория регрессии с и

Поэтому

и если гипотеза верна.

Статистика приводит к критерию для "всей" регрессии в целом, и мы отвергаем гипотезу , если (Здесь верхняя -процентная точка распределения Если гипотеза отвергается, то мы говорим, что регрессия значима и переменными нельзя, вообще говоря, пренебрегать. В то же время отклонение гипотезы вовсе не означает того, что аппроксимирующая регрессия действительно адекватна. Это замечание особенно существенно, когда мы имеем дело с прогнозированием. Исходя из приведенных выше соображёний, (1966, с. 64) предлагают в качестве рабочего правила считать, что аппроксимирующая поверхность может быть удовлетворительной для целей прогнозирования, только если

Полезной мерой степени соответствия аппроксимирующей регрессии имеющимся данным является выборочный множественный коэффициент корреляции Он определяется как коэффициент корреляции между т. е.

Величину обычно называют коэффициентом детерминации. Докажем сейчас одну полезную теорему, обобщающую соотношения (4.18) и (4.20).

Теорема 4.2.

Доказательство, (i) Поскольку то

Кроме того, дифференцируя сумму по получаем одно из нормальных уравнений для , именно

или

Используя это соотношение, находим

поскольку

(первое равенство следует из (4.29), а последнее из (4.28)).

(ii) Из соотношения (4.29) вытекает, что так что

и требуемое выражение для немедленно следует из (4.27).

Отметим, что коэффициент есть простое обобщение коэффициента который появлялся у нас в случае одномерной линейной регрессии. В частности, равенству (4.21) здесь соответствует равенство

из которого видно, что, чем больше значение тем лучше аппроксимирующая поверхность соответствует данным наблюдений. Если то имеем полное соответствие и Если модель содержит единственный х-регрессор, то

Взяв где — обобщенная обратная матрица для находим, что доказанная теорема остается в силе и в случае неполноты ранга матрицы Можно также взять где матрица образована линейно независимыми столбцами матрицы

Покажем теперь, что критерий для проверки произвольной гипотезы вида не затрагивающей значения (а большинство критериев относится именно к такой категории), можно рассматривать как критерий для проверки значимости уменьшения величины

Теорема 4.3. Пусть величина определяется и

Пусть линейные ограничения не затрагивают значения т.е. Тогда -статистика для проверки

гипотезы Я имеет вид

Доказательство. Согласно соотношению (4.4), где симметричная идемпотентная матрица. Поэтому

Ограничения не содержат так что если то равенство приводит к т.е. Таким образом, соотношения (4.28) и (4.29) остаются в силе и при гипотезе Я. Следовательно, теорема 4.2, связанная только с этими двумя соотношениями, также сохраняет силу при гипотезе Я. Дважды применяя обе части теоремы, получаем

Вероятно, наиболее важным является применение этой теоремы к гипотезам вида . В этом случае при введении дополнительного регрессора, скажем остаточная сумма квадратов не может увеличиваться, а, следовательно, коэффициент детерминации — уменьшаться, поскольку (а поэтому и .

Пример 4.4 (Goldberger (1964, с. Докажем, что в общей линейной модели регрессии полного ранга статистика и -статистика для проверки гипотезы не зависят от единиц измерений, в которых выражены

Решение. Для Положим Пусть у—оценка наименьших квадратов вектора в новых единицах измерения. Тогда если то

и

В соответствии с примером 4.3 F-статистикой для проверки гипотезы Я является

где есть диагональный элемент матрицы Если соответствующий ему элемент в то и

Упражнения 4с

(см. скан)

<< Предыдущий параграф Следующий параграф >>
Оглавление