Главная > Математика > Линейный регрессионный анализ
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

7.2. Доверительные интервалы и полосы

7.2.1. Доверительные интервалы для углового коэффициента и свободного члена

В соответствии с разд. 4.1.4 имеем

и

Применяя метод максимального модуля из разд. 5.1.1 (соотношение , мы достигаем вероятности одновременного накрытия, в точности равной , используя для доверительные интервалы

и

где

Более широкие, чем следует, интервалы получаются, если положить

Указанные интервалы можно также использовать для проверки гипотез, касающихся значений обоих параметров Если же нас интересует гипотеза о значении только одного из этих параметров, скажем гипотеза то в этом случае мы используем обычную -статистику

и отвергаем гипотезу с уровнем значимости а при Эту статистику можно получить непосредственно из того факта, что не зависит от

7.2.2. Доверительный интервал для ...

Построим доверительный интервал для отношения используя метод, восходящий к Fieller (1940). Пусть

Тогда Кроме того,

так, что

Разность имеет вид Поэтому она имеет нормальное распределение, а именно Статистика не зависит от (теорема 3.5) (iii) из § 3.4), а следовательно, и от Поэтому, используя обычные рассуждения, приводящие к -статистикам (разд. 4.1.5), получаем:

и -процентное доверительное множество для 6 задается неравенством

Оказывается, это множество сводится к интервалу где и -корни квадратного уравнения

тогда и только тогда, когда коэффициент при в уравнении (7.4) положителен (т. е. линия не слишком уплощена). В этом случае, как следует из уравнения (7.3), соответствующим интервалом для будет и оценка лежит в этом интервале.

Если то и указанный метод приводит к доверительному интервалу для длины отрезка отсекаемого линией регрессии оси абсцисс. Это частный случай обратного предсказания, рассматриваемого в разд. 7.2.6 ,

При изучении популяций животных часто возникает модель

(см. Seber (1973, с. И, 128, 145—148, 150, 298—299, 325)). В подобных приложениях нас интересуют доверительные интервалы именно для отношения так что приведенная выше теория оказывается здесь полезной.

Отметим, что является отношением двух коррелированных нормальных случайных величин. Точное распределение такого отношения указано Hinkley (1969 а).

7.2.3. Интервалы и полосы предсказания

Аппроксимирующая прямая регрессии имеет вид

и, следовательно, проходит через точку Из общей теории § 5.2 видно, что с помощью прогноза можно получить -процентный доверительный интервал для —математического ожидания значения наблюдения в точке интервал имеет вид

где

(Выражение для можно получить и непосредственно — см. упр. 1 в конце главы). Заметим, что минимально при Чем дальше мы удаляемся от тем шире становится доверительный интервал.

Когда нам нужны доверительных интервалов, критическое значение в (7.5) следует заменить на или если мы используем соответственно метод Бонферрони, метод Шеффе или метод максимального модуля. Если, однако, значение не известно или настолько велико, что интервалы получаются слишком широкими, то можно построить доверительную полосу для всей линии регрессии и тем самым получить неограниченное число доверительных интервалов, для которых вероятность одновременного накрытия будет не меньше В

соответствии с (5.18) такая доверительная полоса представляет собой область, заключенную между парой кривых (рис. 7.1)

где Эта полоса, обычно называемая доверительной полосой Уоркинга — Хотеллинга (Working, Hotelling (1929)), имеет переменную ширину (в вертикальном направлении) причем минимальное соответствует точке Интервалы, получаемые на основании этой полосы, являются попросту -интервалами Шеффе.

Другая доверительная полоса с прямолинейными границами (рис. 7.2) предложена Грейбиллом и Боуденом [Graybill, Bowden (1967)] и имеет вид

где

Рис. 7.1. Доверительная полоса Уоркинга-Хотеллинга.

Рис. 7.2. Доверительная полоса Грейбилла — Боудена.

У этой полосы два преимущества по сравнению с полосой (7.7): 1) ее проще вычертить, 2) она имеет меньшую среднюю ширину, хотя это в общем является заблуждением, поскольку усреднение производится по всей полосе, включая экстремальные значения х. В то же время Dunn (1968), а также Halperin, Gurian (1968, с. 1027) показали, что при доверительная полоса (7.7) дает более узкие доверительные интервалы, чем (7.8), если х удовлетворяет (приблизительно) соотношению

Поскольку же считается, что значения на практике не могут превосходить то полоса Уоркинга-Хотеллинга оказывается здесь предпочтительнее. Подобное положение сохраняется и для -процентных доверительных уровней . Обе

рассмотренные полосы можно получить как частные случаи процедуры, предложенной в Bowden (1970) (ср. с формулой (5.19) и последующим обсуждением).

Задачу построения точной доверительной полосы для линии регрессии в случае, когда значения сосредоточены на конечном отрезке впервые решил Gafarian (1964). Он показал, как можно построить полосу, имеющую постоянную ширину , и привел соответствующие таблицы для случая и четных .

Miller (1966, с. 121) провел полезное обсуждение этого метода и указал, что сделанные afarian (1964) ограничения при построении таблиц несущественны. Дело в том, что интервал на котором сосредоточены значения хобычно плохо определен, так что его границы можно скорректировать и считать, что х — средняя точка этого интервала. Кроме того, путем интерполяции табличных значений можно получить приближенные значения и для нечетных Однако Bowden, Graybill (1966) позже получили таблицы для любого конечного интервала и четных Эти таблицы можно использовать и для построения точных доверительных полос трапецеидальной формы, которые могут оказаться более пригодными, чем полосы постоянной ширины, если х лежит вне интервала

Dunn (1968) предложила урезанную модификацию полосы (7.8), которая приводит к более широким доверительным интервалам. Halperin и др. (1967), а также Halperin, Gurian (1968) получили точную полосу, имеющую вид (7.7), но с другим X и урезанную при Однако их таблицы можно использовать только при Значения X табулированы в работе Halperin и др. (1967) для различных значений где

Wynn, Bloomfield (1971) подошли к этой задаче с другой стороны и получили таблицы (воспроизведенные в приложении для произвольного интервала При этом просто вычисляется "стандартизированный" вариант ширины интервала

и по таблицам в приложении отыскивается соответствующее ему значение Если к то

Последнее соотношение связывает таблицы, приведенные в при ложении с таблицами, имеющимися в Halperin и др. (1967). При и получаем как

и следовало ожидать. Вычисления, проведенные Halperin, Gurian (1968), показывают, что эта модификация полосы Уоркинга-Хотеллинга, по-видимому, вообще приводит к доверительным интервалам более узким, чем интервалы, получаемые из полос постоянной ширины и трапецеидальной формы. Поэтому мы рекомендуем как итог использовать полосу (7.7), но значение X в случае определять по таблицам, приведенным в приложении

Наконец, следует упомянуть об односторонних доверительных интервалах. Bohrer, Francis (1972) приводят (верхний) односторонний аналог полосы (7.7). Он имеет следующий вид (мы несколько видоизменили их модель, так чтобы а не

Величина в их обозначениях) табулирована для различных значений в их обозначениях). Нижние односторонние интервалы получаются заменой знаков неравенств на противоположные и заменой X на

<< Предыдущий параграф Следующий параграф >>
Оглавление