Главная > Математика > Линейный регрессионный анализ
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

9.3. Классификация по нескольким признакам при равных числах наблюдений для каждого среднего

9.3.1. Определение взаимодействий и главных эффектов

Обобщение построенной теории на случай классификаций по нескольким признакам при равных числах наблюдений для каждого среднего проводится непосредственно. Мы продемонстрируем, как это делается, на примере классификации по трем признакам:

где независимые случайные величины, каждая из которых имеет распределение Здесь мы имеем три фактора: фактор уровнями, фактор уровнями и фактор С с К уровнями. На каждое из средних имеющихся совокупностей приходится по наблюдений. В дополнение к взаимодействиям (первого порядка) между факторами Ли здесь ймеется возможность наличия взаимодействия (второго порядка) между всеми тремя факторами. Однако если факторы взаимодействуют только попарно, так что, например, на взаимодействие фактор С никак не влияет, то взаимодействие А В будет одним и тем же для всех уровней фактора С. Математически это означает, что - к

или

(Иллюстрирующий это численный пример приведен в упр. 8 в конце главы.) Поскольку выражение для симметрично относительно индексов входящих в него величин, то того же результата следует ожидать, если рассматривать и взаимодействие при различных уровнях фактора и взаимодействие при различных уровнях фактора В. Представляется естественным определить как взаимодействие второго порядка между уровнем фактора уровнем фактора уровнем, фактора С. Далее мы будем говорить о таких взаимодействиях просто как о взаимодействиях

Идеи двухфакторного анализа из § 9.2 можно перенести и на изучаемую ситуацию, рассматривая для каждого уровня фактора С соответствующие таблицы двухфакторного дисперсионного анализа. Так, взаимодействие уровня фактора А с уровнем

фактора В при условии, что фактор С находится на уровне равно

Среднее этих величин по всем значениям фактора С

мы называем взаимодействием уровня фактора уровнем фактора В. Аналогично определяются взаимодействия и

и

По аналогии с разд. 9.2.1 мы определим также следующие главные эффекты:

9.3.2. Проверка гипотез

Используя данные выше определения и обозначая мы приходим к следующей перепараметризации модели:

где

и

причем эти условия выполняются для всех значений индексов

Гипотезы следует проверять в таком порядке: взаимодействия второго порядка равны нулю для всех взаимодействия первого порядка равны нулю для всех для всех для всех главные эффекты равны нулю для всех для всех для всех Если гипотеза Навс верна, то соответствующий трехфакторный эксперимент равносилен трем назависимым двухфакторным экспериментам, каждый из которых относится к одной из трех пар факторов; при

этом взаимодействия первого порядка допускают простую интерпретацию. Например, в таком случае величина (9.37) остается одной и той же для всех так что она равна среднему по всем k (равному ). Подобным же образом, если верна еще и гипотеза то соответствующий трехфакторный эксперимент равносилен двум независимым однофакторным экспериментам для факторов соответственно, и можно легко интерпретировать главные эффекты и например

Как и при классификации по двум признакам, здесь можно применить общую теорию регрессии. Например, полагая

соотношение (9.36) можно представить в виде где -матрица размера ранга Минимизируя сумму относительно мы находим, что

степенями свободы. Чтобы найти для каждой из гипотез сумму RSS, разложим способом, подобным использованному в (938), именно

Переходя к квадратам и суммируя их по находим, что суммы, включающие смешанные произведения, обращаются в нуль, так что

Учитывая, что и используя соотношения (9.38) и (9.39), находим

Левая часть (9.41) достигает минимума, если неизвестные значения параметров равны

Соответствующее минимальное значение равно, конечно, остаточной сумме квадратов, указанной в (9.40). Проверка каждой из частных гипотез производится теперь весьма просто. Например, если мы хотим проверить гипотезу то положим в (9.41) и минимизируем полученную сумму относительно остальных параметров. При этом минимум последней суммы достигается при тех же самых значениях оставшихся параметров, так что

Поэтому

последняя сумма имеет степеней свободы, и соответствующая -статистика равна

Если гипотеза верна, то эта статистика имеет -распределение с и степенями свободы.

Различные квадратичные формы вместе с их степенями свободы приведены в табл. 9.3. Число степеней свободы каждой из этих квадратичных форм можно определить эвристически, как указано в разд. 9.2.2, или найти прямо из следа квадратичной формы. Например, используя эмпирическое правило разложения квадратичных форм из разд. 9.1.2, получаем

След симметричной матрицы, соответствующей этой квадратичной форме, равен сумме коэффициентов при слагаемых равен

Таблица 9.3 (см. скан) Дисперсионный анализ для классификации по трем признакам с наблюдениями на каждое среднее

<< Предыдущий параграф Следующий параграф >>
Оглавление