Главная > Математика > Линейный регрессионный анализ
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

6.2.2. Диагональная дисперсионная матрица

Предположим, что истинная дисперсионная матрица вектора в диагональна:

Тогда оценки максимального правдоподобия для можно получить методами, предложенными Hartley, Jayatillake (1973). Максимизация производится по строго положительным значениям Некоторые процедуры, предназначенные для проверки предположения о том, что все являются независимыми нормальными случайными величинами с одинаковыми дисперсиями, упомянуты в разд. 6.6.5. Однако для общей модели регрессии более информативными оказываются графические методы, описанные в § 6.6.

Довольно распространенным является частный случай построенной теории, в котором считается известным, что дисперсии ошибок внутри определенных групп равны. Предположим, например, что все дисперсии в группе равны, скажем, и что мы хотим проверить гипотезу Тогда, если имеется К взаимно независимых статистик можно проверить гипотезу Я, используя следующие методы.

(а) Критерий Бартлетта

Этот критерий, восходящий к Bartlett (1937а), требует вычисления статистики

где

и

Если гипотеза верна, то статистика распределена приблизительно как причем такая аппроксимация оказывается удовлетворительной и при довольно малых выборках К сожалению, этот критерий слишком чувствителен к любому отклонению от нормальности величин, составляющих каждое Значимость статистики может указывать не на отсутствие однородности дисперсии, а просто на отклонение от нормальности.

(b) Критерий Кокрэна

Если все равны, то для проверки гипотезы Я можно использовать предложенную Cochran (1941) статистику

Этот критерий особенно чувствителен к случаю, когда ожидается, что все дисперсии равны, за исключением, быть может, только одной, которая может оказаться больше остальных [Gartside (1972)]. Процентные точки распределения статистики можно найти в Dixon, Massey (1969, с. 536) или в Pearson, Hartley (1970, с. 203). Значения, отсутствующие в таблицах, можно получить квадратурой из приведенной в Cochran (1941) аппроксимации указанной функции распределения.

(c) Критерий Хартли

Если все равны (скажем, равны то гипотезу можно проверить также, используя статистику Хартли [Hartley (1950)]

Критические точки для этой пррцедуры приведены в работах David (1952) и Pearson, Hartley (1970, с. 202). David (1956) использовал указанное отношение также в следующей процедуре, аналогичной критерию множественных рангов Дункана и предназначенной для упорядочения дисперсий, относящихся к различном - группам. Пусть путем перенумерации мы получаем где наблюдавшееся значение Последовательность критериев состоит в сравнении наибольшего со всеми остальными, начиная с наименьшего, после чего следующий наибольший сравнивается с каждым из оставшихся, начиная с наименьшего, и т. д. Более точно это выглядит следующим образом [Tietjen, Beckman (1972)]. Определим и пусть -верхние -процентные точки распределения статистики Проверку начинаем с Если

то объявляется, что Затем проверяются пока для некоторого не окажется, что При этом объявляется, что для всех Затем подобная процедура повторяется для - вплоть до получения при некотором неравенства и принятия утверждения о том что для всех Весь этот процесс продолжается до получения при некотором неравенства . В работе Tietjen, Beckman (1972) приведены значения для .

Если конкурирующая гипотеза не известна и можно полагаться на нормальность распределений, то из трех приведенных выше критериев критерий Бартлетта оказывается наиболее мощным. В то же время все эти три критерия чувствительны к отклонению от нормальности.

Полезным применением описанных методов является случай повторения опытов (§ 4.4). Пусть представляет собой наблюдение при наборе значений регрессоров, так что

где случайные величины независимы и каждая из них имеет распределение . Положим и Тогда и можно использовать приведенные выше критерии для проверки гипотезы . В частности, если , можно использовать критерий Бартлетта с Если распределения величин не являются нормальными, но при гипотезе все эти распределения имеют одинаковы эксцесс у (равный ), то, как показал Бокс, для больших статистика сходится по распределению к Если (например, для двойного экспоненциального распределения), то предположение о том, что имеет распределение хи-квадрат, дает значимые результаты слишком часто. Если же (например, для равномерного распределения), то же самое предположение приводит к значимым результатам слишком редко (1973, табл. 1)). Из таблиц распределения хи-квадрат видно, что расхождение в уровнях значимости возрастает с ростом

Хотя приведенный выше пример рассматривался в рамках изучения регрессии, из соотношения (6.17) видно, что это есть

по существу задача сравнения дисперсий совокупностей на основании наблюдений над объектами совокупности — задача, возникающая в однофакторном дисперсионном анализе (§ 9.1). Если значения велики (скажем, больше чем 10), что. более свойственно однофакторному анализу, нежели регрессии, то для такого случае имеется ряд устойчивых процедур, а именно: приближенный -критерий Шеффе [Scheffe (1963, с. 126—130)], восходящий к работе Box (1953), в которой предполагалось, что все равны и эксцесс у одинаков для всех совокупностей; приближенный -критерий, основанный на абсолютных уклонениях (Levene(1980), Draper, Hunter (1969)); критерий хи-квадрат Лейярда (Layard (1973)), а также критерий "складного ножа" (Layard (1973)). Некоторые модификации этих процедур, основанные на более устойчивых оценках параметра положения, таких, как медиана, приводят Brown, Forsythe (1974).

<< Предыдущий параграф Следующий параграф >>
Оглавление