Главная > Математика > Линейный регрессионный анализ
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

8.4. Оптимальное расположение точек

При планировании эксперимента с целью подбора полинома степени экспериментатор сталкивается с проблемой расположения точек наблюдений. Если переменная х шкалирована таким образом, что все ее возможные значения за полня отрезок то возникает вопрос, при каких значениях х следует произвести наблюдения переменной У. Ясно, что ответ на этот вопрос зависит от того, какую цель мы преследуем при подборе полинома. Например, состоит ли наша цель в оценивании (всех или только части коэффициентов полинома), интерполяции (например, построении калибровочных кривых) или экстраполяции (прогнозировании)? Для решения подобного рода вопросов предложен ряд критериев оптимальности. Наиболее изучена -оптимальность . Hoel (1958, с. 1137 — 1138) обнаружил, что -оптимальный план одновременно минимизирует величину

План с таким свойством называется минимаксным (или -оптимальным). Эквивалентность оптимальных и минимаксных планов для общей линейной регрессии доказали Kiefer, Wolfowitz (1960) (так называемая теорема эквивалентности; в работе St. John, Draper (1975) имеется полезный обзор на эту тему).

Первый шаг в направлении отыскания -оптимального плана сделал De La Garza (1954). Он показал, что для любого расположения значений х существует другое расположение наблюдений по точкам приводящее к той же матрице Проблему -оптимальности затем решили Hoel (1958) и Guest (1958) (см. также Kiefer, Wolfowitz (1959), где исследование проводится в более общем виде), показавшие, что для получения -оптимальности следует провести по ;

наблюдений в точках где наблюдения распределены между точками поровну), а суть нулей полинома Здесь полином Лежандра степени В этом случае что можно использовать для проверки оптимальности. В работе Kussmaul (1969) приведены соответствующие значения для .

Иногда исследователя интересует лишь часть коэффициентов Понятие -оптимальности определено и для этого частного случая (см., например, St. John, Draper (1975), где имеется общий обзор). Если мы интересуемся лишь коэффициентом то наиболее разумным является выбор плана, минимизирующего Эту задачу решили Kiefer, Wolfowitz (1959), получив оптимальное решение

точки в виде

(Они называются чебышевскими точками, потому что Тк При теоретическом исследовании оптимальности удобно допускать нецелые значения Такие планы называются приближенными или непрерывными. Если числа оказываются нецелыми, то зеальный план является целочисленной аппроксимацией оптимального непрерывного плана. Случаи 1, 2 детально разобраны в работе Atkinson (1972).

Если нас интересует любая из оценок то можно определить оптимальный план как план, минимизирующий величину

Elfving (1959) назвал план с таким свойством минимаксным по шному параметру, a Studden (1968) нашел оптимальное решение в этом случае. Murty (1971) указал полезное достаточное условие для проверки оптимальности в указанном выше смысле и привел несколько примеров.

Значительное внимание в литературе уделено также задаче экстраполяции. Если нас интересует такой план, который минимизирует дисперсию прогноза в точке х, где то соответствующим решением будет опять (8.23), но только

распределение наблюдений по точкам будет уже другим [Hoel, Levine (1964)]:

где

является полиномом Лагранжа. Эту работу обобщили Kiefer, Wolfowitz (1965) (см. Karlin, Studden (1966), Studden (1968), a также Herzberg, Cox (1972)).

Указанные решения задачи выбора плана имеют один серьезный недостаток. Мы предполагаем, что известно и что наблюдается только при различных значениях х, так что подбор с помощью (взвешенного) метода наименьших квадратов, использующий средние значения при каждом является точным, и мы не имеем в своем распоряжении остатков, с помощью которых можно было бы проверить выполнение предположений, лежащих в основе исследования. Ввиду того что на практике значение обычно не известно, оптимальное решение может оказаться и неудовлетворительным, поскольку оно не дает возможности исследовать адекватность подобранной кривой. Чтобы обойти это затруднение, Box, Draper (1959, 1963) [см. также Kupper (1973), Kupper, Meydrech (1973), Kiefer (1973 и Thompson (1973)] определили оптимальность посредством минимизации интегральной среднеквадратичной ошибки прогноза. Они обратили основное внимание на квадрат смещения, поскольку представляется, что именно это слагаемое вносит основной вклад в ошибку. Кarson и др. (1969) и Cote и др. (1973), приняв такую же точку зрения, рассмотрели планы, минимизирующие интегральный квадрат смещения. Однако Stigler (1971) подверг такой критерий оптимальности критике и предложил модификации обычных -оптимальных и минимаксных планов. называл свою модификацию С-огра-ниченным планом, поскольку в случае подбора дополнительного слагаемого требуется выполнение условия

где С — заранее выбранное число. Выбор С выражает компромисс между двумя противоречивыми целями: точными выводами о значении и точными выводами о полиноме степени . С одной стороны, значение С следует выбирать достаточно малым, чтобы можно было выявлять практически значимые отклонения от

дели с предписанной точностью (например, задав мощность критерия для проверки гипотезы С другой стороны, большие значение С приводят к более эффективным планам для подбора полинома степени . К сожалению, найти С-ограниченный оптимальный план вовсе не просто, и Стиглером было приведено решение этой задачи только для

В случае, когда значение не известно, имеется ряд других подходов к задаче построения оптимального плана. Например, Hoel (1968) и Kussmaul (1969), рекомендовали использовать -оптимальный план для максимальной степени, которую экспериментатор готов принять. Atwood (1971), однако, считает, что следует подбирать полином некоторой заданной степени (скажем, и вдобавок к нему "малый" полином заданной достаточно высокой степени к, и предлагает использовать взвешенную комбинацию -оптимальных планов для степеней Он делает упор скорее на устойчивость, а не на оптимальность плана.

Задачу отыскания оптимальных планов для оценки наклона линии (полиномиальной) регрессии рассматривали Murty, Studden (1972). Случай полиномов второго порядка был исследован в работе Ott, Mendenhall (1972).

<< Предыдущий параграф Следующий параграф >>
Оглавление