Главная > Математика > Линейный регрессионный анализ
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Приложение С. НОРМАЛЬНАЯ ВЕРОЯТНОСТНАЯ БУМАГА

Если то график функции распределения представляет собой -образную кривую, изображенную на рис. 1. В то же время, применяя нелинейное преобразование масштаба по оси у, можно преобразовать эту кривую в некоторую прямую. Вид этого преобразования можно сделать наглядным, если представить себе, что указанная кривая начерчена на упругом листе и этот лист растягивается таким образом, чтобы обратить эту кривую в прямую. Направления и величины соответствующих усилий показаны на рис. 1. Существует специальным образом разграфленная бумага (см. рис. 2), в которой масштаб по вертикали (выраженный в процентах) соответствует указанному нелинейному преобразованию. Такую бумагу называют нормальной вероятностной бумагой или просто вероятностной бумагой. График зависимости от выражается на такой бумаге прямой линией

Если то на рис. 2 соответствующий график также будет изображаться прямой линией но о другим наклоном и другим параметром положения.

Основой для построения вероятностной бумаги служит следующая лемма.

Лемма. Если упорядоченная выборка из распределения то

Доказательство (набросок). Рассмотрим преобразование Поскольку —монотонно возрастающая функция, существует обратная функция Если —плотность распределения вероятности случайной величины то плотность распределения вероятности случайной величины равна

(кликните для просмотра скана)

т. е. U имеет равномерное на [0, 1] распределение. Поэтому, если упорядоченная случайная выборка из этого равномерного распределения. Из соображений симметрии можно ожидать, что значения делят интервал на приблизительно равных частей. Таким образом,

(Более точно, можно показать, что имеет бета-распределение; см., например, David (1970).)

Можно также показать [David (1970, с. 64—67, 161—163)], что

или

Таким образом, в силу (2) предположение о том, что можно проверять, сравнивая Можно поступать и иначе и, используя выражения (3) и (1), сравнивать с либо либо Если использовать вероятностную бумагу, то надо начертить график зависимости или от При достаточно больших (когда наблюдения достаточно близки к их математическим ожиданиям) нормальность случайной величины будет выражаться в приблизительно линейном характере этого графика.

По причинам главным образом практического характера предпочитают иметь дело с не с . Кроме того, обычно вероятностную бумагу ориентируют таким образом, что нелинейная шкала располагается на оси х, и вычерчивают график зависимости от Несколько примеров подобных графиков с размерами выборок от 8 до 384 приводят Daniel, Wood (1971, с. 34—43), и читателю стоит обратиться к ним. Эти авторы заключают, что выборки объема 8 почти ничего не говорят о нормальности; выборки объема 16 очень неустойчивы; выборки объема 32 ведут себя явно лучше; выборки объема 64 почти всегда в центральной области графика похожи на прямую, но флюктуируют на краях графика; выборки объема 384 выглядят очень устойчивыми, за исключением нескольких наименьших и наибольших точек. Значение рекомендуется брать не меньшим 20,

предпочтительнее большим 50. Дальнейшие подробности относительно графиков вероятностей и ссылки на соответствующую литературу можно найти в Wilk, Gnanadesikan (1968). Некоторые интересные графики для распределений, отличных от нормального, представлены в книге Hahn, Shapiro (1967,.гл. 8).

Если построение графика производится автоматически, то вычерчивают график зависимости от с выражением Для имеется целый ряд эффективных численных аппроксимаций. Andrews, Tukey (1973) описывают грубый, но в то же время полезный метод построения графиков, использующий шестистрочную печать телетайпа.

Вычерчивание графиков, вероятностей не только приносит пользу при исследовании остатков (§ 6.6), но также используется при рассмотрении различных гипотез в некоторых ситуациях дисперсионного анализа. Например, Daniel (1959) использовал так называемую "полунормальную" бумагу в анализе факторных планов типа При нулевой гипотезе о том, что способ обработки не оказывает реального влияния ни на один из факторов, абсолютные величины различных сравнений (главные эффекты, взаимодействия первого порядка, взаимодействия второго порядка и т. д.) ведут себя подобно случайной выборке из полунормального распределения. Поэтому, если вычертить график зависимости абсолютных значений этих сравнений от репрезентативных (представительных) значений стандартного полунормального распределения, то при отсутствии реальных эффектов или взаимодействий график должен вести себя как прямая, проходящая через начало координат. Наличие же эффектов и взаимодействий выражается в больших уклонениях значений соответствующих сравнений от линейной конфигурации.

В то же время применить такой метод в общем дисперсионном анализе гораздо труднее, поскольку даже при нулевой гипотезе об отсутствии эффектов, взаимодействий и т. д. средние квадраты в обычной таблице дисперсионного анализа имеют разные распределения из-за различного числа степеней свободы. Один из подходов к этой задаче предлагают Gnanadesikan, Wilk (1970).

<< Предыдущий параграф Следующий параграф >>
Оглавление