Главная > Математика > Линейный регрессионный анализ
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

6.7. Преобразование данных

Если обычные предположения нормальности представляются невыполненными, то делу может помочь нелинейное преобразование данных. Например, если теория предполагает наличие связи, приблизительно имеющей вид и можно ожидать, что связь между и х приблизительно линейная. Однако при выполнении подобных преобразований необходимо уделять особое внимание "ошибке". Например, если ошибка мультипликатйвка, так что

где то изменяется вместе с В то же время при переходе к логарифмам мы получаем

где равна некоторому а. Если ошибка распределена нормально, то распределение уже не будет нормальным, и наоборот.

С другой стороны, если ошибка в наблюдениях К аддитивна, так что

то

и дисперсия изменяется вместе с Таким образом, если в первом случае переход к логарифмам стабилизирует дисперсию ошибки, то во втором случае такой переход приводит к тому, что дисперсия "ошибки становится зависящей от х через Влияние всякого преобразования можно исследовать путем повторного построения графиков остатков.

Полезным является следующее семейство преобразований:

Оно подробно рассмотрено в Тикеу (1957) для и охватывает такие хорошо известные преобразования, как переход к логарифмам, переход к квадратным корням, обратное преобразование. Чтобы избежать разрыва при , Box, Сох (1964) рассмотрели модифицированное семейство

по существу идентичное (6.54), если модель регрессии содержит постоянную составляющую [Schlesselman (1971)]. Они предполагают, что для некоторого X преобразованные наблюдения удовлетворяют предположениям нормальной теории, т.е. При этом функция правдоподобияхдля исходных наблюдений имеет вид

где

есть абсолютная величина якобиана преобразования. При фиксированном значении X функция правдоподобия (6.56) с точностью до постоянного множителя соответствует стандартной задаче наименьших квадратов. В соответствии с разд. 4.1.2 максимальное значение этой функции правдоподобия равно где

Поэтому с точностью до константы отношение максимального правдоподобия равно

где

а у — среднее геометрическое величин т. е. предлагают определять значение X, максимизирующее это отношение правдоподобия, непосредственно по графику зависимости от К. Более точно значение X можно найти, решая уравнения (см. уравнение (12) в Box, Сох (1964) или уравнение (9) в Schlesselman (1971)). Некоторые

свойства оценки X рассматриваются в Draper, Сох (1969). В работе Box, Сох (1964) рассматривается также байесовское оценивание параметра К.

Для проверки пригодности преобразования, соответствующего некоторому значению указанные авторы предлагают использовать статистику критерия отношения правдоподобия асимптотическим распределением которой при гипотезе является Andrews (1971b) предложил "точный" критерий для проверки гипотезы Однако исследование, предпринятое в Atkinson (1973), показывает, что мощность этого критерия, по-видимому, меньше, чем у критерия отношения правдоподобия.

Приближенная -процентная доверительная область для истинного значения К состоит из всех тех для которых

где

На практике может возникнуть желание преобразовать не только значения у, как в рассмотренной выше модели и значения х. В таком случае можно выполнить это желаемое преобразование и, используя развитую выше теорию, включающую только значения у, решить, нужны ли какие-нибудь дополнительные изменения модели. Указанный метод можно сочетать с процедурой Box, Tidwell (1962), в которой преобразуются как раз регрессоры. Если значения у могут быть отри: цательными, то следует работать с величинами где подбирается таким образом, чтобы

В статье Box, Сох (1964) можно найти два интересных приложения приведенной теории, а также справиться относительно дальнейших подробностей. Еще один пример, содержащий критерий для проверки гипотезы (т. е. гипотезы о линейной зависимости от ), имеется в Sclove (1972). Вопрос о подборе необходимого преобразования в случае единственного регрессора обсуждается в § 7.1.

Иногда полезно иметь какое-нибудь простое преобразование, приводящее к нормальности и однородности дисперсии, но не обязательно приводящее к линейности. Метод получения такого преобразования описал Wood (1974).

Упражнения к гл. 6

(см. скан)

(см. скан)

<< Предыдущий параграф Следующий параграф >>
Оглавление