Главная > Математика > Линейный регрессионный анализ
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

9.4. Классификация с одним наблюдением на каждое среднее

9.4.1. Получение статистик критериев

Предположим, что в классификации по двум признакам мы имеем только по одному наблюдению на каждое среднее, так что модель принимает вид

где случайные величины независимы и каждая из них распределена по закону Мы имеем в такой ситуации наблюдений и неизвестных параметров так что мы не можем оценить все эти параметры, не введя по крайней мере одного дополнительного ограничения, уменьшающего число "свободных" параметров. Однако, как правило, подобные данные возникают при использовании планов с рандомизированными блоками, с способами обработки и блоками. Поскольку же способы обработки внутри каждого блока рандомизированы, то следует ожидать, что взаимодействие между способом обработки и блоком мало. Таким образом, разумным является следующее предположение:

или где С является -матрицей с линейно независимыми строками (ср. с разд. 9.2.2). Записывая (9.42) в виде егде мы можем проверить гипотезы (или при линейных ограничениях используя общую теорию § 4.6. Например, для проверки гипотезы можно использовать статистику

Остаточные суммы квадратов и RSS можно найти непосредственно, используя метод разд. 9.2.2. Поэтому по аналогии с разложением мы имеем разложение

которое приводит к

Применяя к рассматриваемой модели ограничения (9.43), получаем

и отсюда

Минимум левой части (9.44) достигается при так что

(мы обозначаем Поскольку взаимодействия равны нулю, то, как видно из приведенного соотношения, "сумма квадратов взаимодействий" играет роль суммы квадратов ошибок, и несмещенная оценка для равна то же время стоит заметить, что оценку для можно получить при существенно более слабых предположениях: вовсе не обязательно требовать, чтобы все взаимодействия были равны нулю [Johnson, Graybill (1972а, b)].

Полагая и рассматривая соотношение (9.44), видим, что его левая часть достигает минимума при так что

и

Поэтому -статистика для проверки гипотезы имеет вид

Статистика критерия для проверки гипотезы получается заменой индекса на

Всю эту процедуру можно отразить в таблице, как это сделано в табл. 9.4.

Распространение изложенной теории на классификации по нескольким признакам производится непосредственно. Так, например, при трехфакторном дисперсионном анализе, описанном в табл. 9.3, мы просто полагаем и в качестве суммы квадратов ошибок используем сумму квадратов, соответствующую взаимодействию всех трех факторов -взаимодействие).

9.4.2. Предположения, лежащие в основе модели

Влияние нарушения предположения об отсутствии взаимодействий на статистику (9.45) рассматривал Scheffe (1959, с. 197— 200). Это предположение часто называют также предположением аддитивности, поскольку при этом и главные

Таблица 9.4 (см. скан) Дисперсионный анализ для классификации по двум признакам с одним наблюдением на каждое среднее


эффекты "аддитивны". Поскольку в (9.42) нельзя оценить все параметры, то мы не можем проверить и гипотезу (9.43) против общего класса альтернатив (хотя бы для одной пары В то же время можно проверить гипотезу (9.43) против выбранного надлежащим образом более узкого класса альтернатив. Рассмотрено несколько таких случаев. Например, если предположить, что то, известный критерий Тьюки для проверки аддитивности равносилен проверке нулевой гипотезы против альтернативы [Scheffe (1959, с. 191—201)]. Статистика критерия Тьюки имеет вид

где

и

Если модель в действительности имеет вид

то эта статистика имеет -распределение с степенями свободы соответственно. Представляется полезным получить (9.47) с помощью следующей леммы, принадлежащей Scheffe (1959, с. 212, упр. 4.19).

Лемма. Предположим, что где матрица X имеет размер и ранг и пусть где оценка наименьших квадратов вектора Пусть произвольная непрерывная функция от 0 (выбираемая до рассмотрения результатов наблюдения вектора а — такая же линейная функция от как от Пусть далее и

Тогда

Доказательство. Прежде всего, так что и

Рассмотрим условные распределения случайных величин при фиксированном Поскольку не зависит от (теорема из § 3.4), а следовательно, и от то условное распределение совпадает с соответствующим безусловным распределением, а именно с (теорема Кроме того, из имеем где зависит от 0, а следовательно, и от Поэтому

и

так что Полагая теперь и привлекая неравенство Коши-Шварца , получаем

Поскольку то в соответствии теоремой 2.9 (§ 2.4) случайные величины независимы и имеют распределения и соответственно. Таким образом, и поскольку это -распределение не зависит от то оно является безусловным распределением

Чтобы применить эту лемму к статистике (9.47), определим функцию соотношениями где

Тогда

и

Используя равенство после ряда преобразований получаем

так что

и мы приходим к статистике (9.47). Аналогичным методом можно получать статистики критериев для взаимодействий и при других планах экспериментов, предполагающих наличие аддитивности, например для латинского квадрата.

Критерий Тьюки (в котором первоначально ничего не предполагалось о виде взаимодействий по-видимому, имеет достаточно хорошую мощность при альтернативах [Ghosh, Sharma (1963)]. Влияние на этот критерий отсутствия нормальности изучено эмпирическим путем в работе Yates (1972). Было предложено также несколько обобщений указанной процедуры (ссылки можно найти в работе Johnson, Graybill (1972а, b)). Все эти критерии, по-видимому, имеют достаточно хорошую мощность, если является функцией от или Johnson, Graybill (1972b) предложили также критерий для взаимодействия, который имеет достаточную мощность, если рассматриваемая модель имеет вид

где

Графики остатков, основанные на остатках следует интерпретировать весьма осторожно. Нерегулярности в этих графиках могут возникать либо вследствие нарушения обычных предположений нормальности, либо из-за наличия ненулевых взаимодействий (т.е. для некоторых Поскольку -критерии, основанные на статистиках (9.45) и (9.46), квадратично сбалансированы, то следует ожидать того, что эти статистики будут устойчивы по отношению к уклонениям от нормальности. Гипотезы об однородности дисперсии или о корреляции ошибок внутри блоков можно проверить, используя, например, методы Han (1969).

9.4.3. Альтернативный подход

Если мы предполагаем аддитивность в плане с рандомизированными блоками, то получаем модель

Она имеет неполный ранг и поэтому может быть исследована любым из указанных в § 3.8 методов. Например, можно ввести идентифицирующие ограничения вида а. и использовать указанный в разд. 11.5.4 алгоритм образования остаточных сумм квадратов. Такой способ может быть полезен при анализе планов с неполными блоками, где каждый блок не включает в себя всех способов обработки.

<< Предыдущий параграф Следующий параграф >>
Оглавление