Главная > Математика > Линейный регрессионный анализ
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

8.5. Многомерная полиномиальная регрессия

8.5.1. Подбор аппроксимирующей поверхности

Значительное внимание в литературе уделено задаче подбора полинома второй степени от нескольких переменных

Как оказывается, вся теория ортогональных полиномов может быть обобщена и для использования ее в двумерном случае. И здесь фундаментальную роль играют полиномы Чебышева. За подробностями мы отсылаем читателя к работе Hayes (1974).

8.5.2. Поверхности отклика

Одним из наиболее важных применений полиномиальной регрессии от нескольких переменных является изучение поверхностей отклика. Мы проиллюстрируем некоторые основные черты этой методологии, рассматривая случай, когда имеются только два регрессора.

Предположим, что "отклик" (выход) в заданном эксперименте является неизвестной функцией от двух переменных: (температуры) и (концентрации). Предположим также, что поверхность в трехмерном пространстве, реализующая эту функцию, "ведет себя достаточно хорошо". В частности, пусть

она является гладкой и имеет единственный хорошо выраженный пик. Значение отклика измеряется с ошибкой, так что в действительности мы наблюдаем величину где Основная задача теории откликов состоит в оценке координат вершины указанного пика.

Один из способов решения этой задачи заключается в использовании последовательности экспериментов и метода быстрейшего восхождения для "подъема на вершину" поверхности. Для точек, удаленных от точки максимума, поверхность является относительно линейной, так что ее можно приблизить в окрестности такой точки некоторой плоскостью

Для оценки коэффициентов можно использовать, например, так называемый -план, в котором наблюдаются значения в четырех вершинах малого прямоугольника с центром на плоскости (рис. 8.1).

Рис. 8.1. Поверхность отклика..

Предположим, что мы наблюдаем при этом значения величины в точках где два выбранных значения переменной два выбранных значения переменной Тогда мы можем подбирать к этим данным модель

где и получить аппроксимирующую плоскость в виде

Если — точка этой плоскости, расположенная по вертикали над точкой то плоскость, аппроксимирующая поверхность

в окрестности точки может помочь нам переместиться в сторону более высокой точки поверхности и соответственно получить большее значение К. Например, если в положительны, то следует увеличить Однако наиболее эффективный способ подъема состоит в перемещении по направлению наибольшей крутизны. Для отыскания этого так называемого пути быстрейшего подъема рассмотрим следующую задачу. Предположим, что нам нужно максимизировать разность при условии Используя множитель Лагранжа имеем

Приравнивая правой части (8.28), находим, что значения соответствующие максимальному значению указанной разности, должны быть пропорциональны значениям Поэтому, рассматривая как начало координат, следует выбрать координаты точки следующего наблюдения в виде где какое-нибудь положительное число. Постепенно увеличивая значения мы можем проводить измерения соответствующих значений К до тех пор, пока не достигнем такой точки на плоскости в которой изменение при изменении становится или очень малым, или даже отрицательным. После этого мы реализуем новый -план на малом прямоугольнике с центром в точке и подбираем новую плоскость (8.28). Затем опять определяем направление быстрейшего подъема и движемся в этом направлении, пока не достигнем малых изменений в значениях скажем в точке На этом пути мы продвигаемся в сторону вершины поверхности.

При приближении к вершине значения становятся все более малыми и продвигаться, используя метод быстрейшего подъема, становится все труднее. Здесь уже существенное влияние на значения оказывает кривизна поверхности. Поэтому в непосредственной близости к вершине можно подбирать не плоскость, а квадратичный полином вида (8.25), используя для этой цели, скажем, -план. Этот план состоит в использовании трех значений и трех значений и в наблюдении значений в соответствующих 9 точках. Посредством переноса начала и поворота осей аппроксимирующую поверхность

можно представить в каноническом виде

здесь — оценки координат вершины поверхности. Тройку чисел проще всего найти, беря частные

производные (8.29) по и решая получающуюся пару уравнений относительно При этом мы получаем значения а значение есть просто значение у в (8.29) при

Приведенное нами довольно беглое описание методологии, связанной с поверхностями отклика, оставляет открытыми целый ряд вопросов. Укажем, например, такие из них:

(1) В указанном рассмотрении мы использовали для подбора плоскости в качестве плана первого порядка -план, а для подбора квадратичного полинома (в качестве плана второго порядка) - -план (план второго порядка). При этом возникает вопрос: какие планы лучше использовать в каждом из этих случаев?

(2) Как мы можем узнать, когда надо переходить от плана первого порядка к плану второго порядка?

(3) Как следует выбирать значения

(4) Что будет, если в процессе подъема мы попадем в стационарную точку, не являющуюся максимумом, или на медленно повышающийся гребень? (Подобная ситуация соответствует случаю, когда в (8.30) то или иное значение к; оказывается отрицательным.)

Хотя у нас и нет возможности рассматривать здесь эти и другие важные в практическом отношении вопросы, некоторые комментарии относительно планов первого порядка все же уместно сделать. Мы видели в § 3.5 (лемма), что планы с ортогональной структурой обладают некоторыми свойствами оптимальности. В частности, -план относится к этой категории и является -оптимальным если шкалировать значения так, чтобы они принимали значения ±1. Для изучения этой ортогональной структуры удобно представить символически два уровня значений переменной в виде 1 и а, а два уровня значений переменной виде Тогда все четыре возможных комбинации можно представить символически (перемножая значения уровней в каждой паре) как а значения в этих точках — как соответственно. В такой записи модель (8.27) принимает вид

или где столбцы матрицы X взаимно ортогональны и удовлетворяют условиям леммы из § 3.5. Поэтому

так что

и

Если использовать терминологию факторного анализа и именовать "факторами" то и — суть оценки величин, которые можно было бы назвать главными эффектами факторов соответственно.

Дальнейшее рассмотрение общей теории выбора оптимальных планов для анализа поверхностей отклика можно найти в работах Box, Draper (1971, 1975), Atkinson (1972), Thompson (1973) и Mitchel (1974b). Описание методов анализа поверхности отклика имеется в работах Davies (1960), Hill, Hunter (1966, обзорная статья), John (1971, гл. 10), Guttman и др. (1971, с. 435 и далее), а также в работах Myers (1971), Налимов, Чернова (1965, В дополнение к методу быстрейшего подъема Box (1957) и Box, Draper (1969) предложили другой метод, известный под названием эволюционного планирования, который можно рекомендовать для использования в промышленности. Этот метод, однако, не используется столь широко, как это могло бы быть, и мы отсылаем читателя за полезными комментариями по этому поводу к работам Hahn, Dershowitz (1974) и Lowe (1974).

Упражнения к гл. 8

(см. скан)

(см. скан)

<< Предыдущий параграф Следующий параграф >>
Оглавление