Главная > Математика > Линейный регрессионный анализ
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА

В наше время благодаря расширению возможностей ЭВМ становится все проще анализировать большие массивы данных. Это приводит к бурному росту приложений многомерной статистики, что вызывает в свою очередь развитие соответствующей теории, причем статистическая теория меняется в сторону ее "компьютеризации".

Книга Дж. Себера вполне отражает эту тенденцию развития регрессионного анализа. Она занимает особое место среди имеющихся у нас книг по данному предмету и располагается где-то посредине между трудно читаемыми научными монографиями и практическими руководствами рецептурного плана. По стилю изложения она, пожалуй, примыкает к соответствующим разделам тома 2 недавно переведенной и быстро разошедшейся известной монографии М. Кендалла и А. Стьюарта "Статистические выводы и связи" и к ранее вышедшей книге Г. Шеффе "Дисперсионный анализ", но отличается большей элементарностью и полнотой вводной части. Книга Дж. Себера современна (она основана на работах до 1975 г. включительно) и почти наполовину состоит из описания вычислительных аспектов, регрессионного анализа, многие из которых у нас раньше не освещались. К тому же в книге много полезных задач с набросками их решения.

Благодаря этим особенностям, книга послужит, по нашему мнению, хорошим пособием как для студентов-математиков (особенно вычислительной специализации), так и для специалистов-экспериментаторов, а также окажется полезной для самообразования.

Изложение основано на курсах разного уровня, читавшихся автором на протяжении многих лет. Это, с одной стороны, способствует большей легкости усвоения, но с другой — приводит к трудностям при "сшивании" материала различной сложности и к некоторой непоследовательности изложения. Например, такие понятия, как условные математические ожидания, распределения и т. д., используются без строгого определения, хотя долго обсуждается элементарное понятие независимости (кстати, после

того, как оно уже было использовано ранее без определения), на протяжении книги часто фигурирует в качестве примера полностью рандомизованный план, хотя нигде не определяются понятие рандомизации и его смысл, и т. д.

По этим причинам книга не может рассматриваться как введение в математическую статистику: она предполагает - понимание ее некоторых фундаментальных понятий, и внимание автора сосредоточено в основном на вычислительных аспектах. Прежде всего выделим содержательные главы 11 и 12, которые полностью новы для советского читателя. В первой из них изложены алгоритмы, лежащие в основе различных программ регрессионного анализа для ЭВМ. На этой основе в главе 12, по-видимому, впервые в мировой литературе систематически излагаются различные эвристические методы выбора наилучшего подмножества регрессоров — трудной проблемы, имеющей огромное прикладное значение. Отметим также изложение пересчета результатов при добавлении или пропуске регрессоров, введение в альтернативные к классическим методы оценивания упрощение анализа при наличии пропущенных наблюдений работы с ортогональными полиномами, сплайнами и эмпирическими остатками Модному сейчас использованию обобщенных обратных матриц при анализе вырожденных моделей уделяется сравнительно скромное место, что способствует большей наглядности изложения (хотя и делает его более пространным).

Полезно также, что дисперсионный и ковариационный анализ излагается в главах 9 и 10 на основе уже разобранного регрессионного анализа, что способствует унификации и ясности изложения. К сожалению, в книге нет упоминания о смешанных моделях дисперсионного анализа [см. Rao (1973), Searle (1971), Kendall, Stewart (1968)].

Интерес представляют и разделы, где на элементарных примерах обсуждаются сравнительно тонкие и малоизвестные вопросы теории. Среди них выделим:

1) Обстоятельное обсуждение различных аспектов проблемы построения доверительных интервалов, в частности, для совокупности оцениваемых параметров для всех точек оцениваемой поверхности отклика над некоторой областью аргумента (гл. 5 и 7), для обратной задачи предсказания аргумента по измерениям зависимой переменной д.

2) Влияние сбалансированности плана эксперимента на устойчивость -критерия при нарушении нормальности ошибок.

3) Проверка предположений регрессионного анализа на основе изучения эмпирических остатков.

Стоит отметить, что вопросам планирования эксперимента в книге уделено малое, место, а имеющиеся подходы несовершенны. По этому поводу читатель может обратиться к имеющимся

у нас руководствам, например к книге В. В. Федорова (1971)

В заключение следует сказать, что чтение книги оставляет впечатление полезной и обстоятельной беседы с человеком, мастерски владеющим вычислительными и статистическими аспектами регрессионного анализа. Полагаю, что книга Дж. Себера привлечет внимание к изложенным в ней вопросам регрессионного анализа и послужит повышению уровня прикладных и теоретических работ в этой области.

М.Б. Малютов

<< Предыдущий параграф Следующий параграф >>
Оглавление