Главная > Математика > Статистический анализ временных рядов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

3.3. СГЛАЖИВАНИЕ

3.3.1. Сглаживающие процедуры

Иногда тренд является гладкой функцией времени, флуктуирует на любом коротком интервале времени незначительно и все же его невозможно представить простой функцией времени на всем рассматриваемом интервале. Тем не менее простая мысль о том, что тренд гладкий, а случайные ошибки, как правило, нерегулярны, приводит к естественной статистической технике сглаживания. Сглаживание временного ряда означает представление тренда в данной точке посредством взвешенного среднего значений, наблюдаемых в окрестности этой точки. При этом считается, что наблюдаемые значения являются суммой тренда и случайной ошибки. Грубо говоря, взвешенное среднее тренда совпадает со значением самого тренда в данной точке, а взвешенное среднее случайных

составляющих имеет тенденцию становиться весьма малой величиной (предполагается, что случайные составляющие независимы и имеют нулевые математические ожидания). Поэтому взвешенное среднее наблюдаемых значений будет оценивать тренд. Оно определяется для каждого момента времени, за исключением нескольких первых и нескольких последних точек. Тем самым довольно нерегулярный график наблюдений заменяется гладким графиком скользящего среднего.

Опишем более четко, что мы понимаем под сглаживанием. Под гладкой функцией мы подразумеваем функцию, которая может быть адекватно представлена полиномом достаточно низкой степени на некотором не слишком малом интервале времени. Это понятие до некоторой степени оправдывается теоремой Тейлора. (Нас фактически интересует здесь приближение только для нескольких целых значений аргумента.) Полиномы, аппроксимирующие функцию, не обязаны быть одинаковыми на различных интервалах. Полином, подобранный на одном интервале, может не иметь ничего общего с указанной гладкой функцией в любой другой части отрезка наблюдения. Приведем в качестве примера тренд, составленный из выпуклой и вогнутой парабол:

для некоторого целого . В точке значения и самих этих парабол и их первых производных совпадают. Так определенная функция будет гладкой. Она является полиномом первой или второй степени для любых трех последовательных точек и представима параболами на достаточно длинных интервалах времени. Однако парабола, представляющая функцию на первой половине всего интервала, весьма отличается от второй параболы. В действительности указанная функция довольно близка на интервале от 0 до к полиному третьей степени. (См. упр. 20.) Смысл приведенных рассуждений состоит в том, что предположение о гладкости тренда является локальным свойством, в то время как предположение о полиномиальном характере тренда связано со всем интервалом Соответственно предположение гладкости позволяет использовать для оценки тренда в данной точке только наблюдения вблизи этой точки, в то время как предположение о полиномиальном характере тренда приводит к тому, что для оценки полинома, представляющего тренд на всем интервале, используются все наблюдения.

Пусть имеются наблюдения Оценим тренд в точке посредством величины

являющейся взвешенным средним наблюдаемых значений в

интервале значений временного параметра отстоящих от не более чем на единиц. Веса предполагаются нормированными, так что

(Пределы суммирования можно брать без потери общности симметричными относительно нуля, поскольку некоторые могут быть равны нулю.) Полученная таким образом последовательность называется скользящим средним исходной последовательности Если то

где

Как и прежде, предполагается, что В силу этого и имеет дисперсию Веса выбираются так, чтобы дисперсия величины и была значительно меньше, чем дисперсия величины Если значения близки к той будет близко Поэтому скользящее среднее, или сглаженный ряд имеет примерно ту же последовательность математических ожиданий, что и но зато меньшую дисперсию (одинаковую для всех членов Однако последовательные члены сглаженного ряда в общем случае являются коррелированными. Именно

Одним из частных случаев скользящего среднего является арифметическое среднее, для которого В этом случае сглаженное значение выражается формулой

Слагаемое, представляющее усредненную ошибку, имеет диспер сию как среднее некоррелированных переменных. Ковариации (последовательных) значений суть

Общая основа для большинства формул сглаживания состоит фактически в подборе сглаживающего полинома по последовательным наблюдениям и в использовании этого полинома для оценки тренда в средней точке. Поскольку оценки коэффициентов полинома зависят от наблюдаемых значений линейно, то линейной является и оценка тренда. Вследствие этого она имеет вид (2). Предположим теперь, что тренд в точках можно приблизить полиномом

(Коэффициенты зависят от но мы не будем отмечать этого в обозначениях.) В частности, приближенно равно Коэффициенты этого полинома можно оценить на основании наблюдений используя метод наименьших квадратов. Нормальные уравнения для оценок имеют вид

В силу симметрии для любых нечетных степеней сумма величин по всем значениям от до равна нулю. Поэтому в соотношении (10) для четных равны нулю коэффициенты при а для нечетных равны нулю коэффициенты при Поскольку оценка для должна быть и оценкой для то достаточно решить (10) относительно . С этой целью воспользуемся уравнениями с четными т. е.

где

Заметим, что уравнения, которые необходимо решить для определения при нечетном значении в точности совпадают с уравнениями, которые надо решить для определения при меньшем на единицу (четном) значении q. (Нам необходимо исследовать только степени 0, 2, 4 и т. д.) Пусть Тогда (11) можно записать в виде

Коэффициенты в левых частях этих нормальных уравнений зависят только от Коэффициенты при в правых частях совпадают, Решением (13) относительно является

Заметим, что коэффициенты зависят от и являются полиномами Из (14) вытекает, что Используя (14) и замечая, что если то наилучший выравнивающий полином, можно получить соотношение

Положим для примера т. е. используем для оценки значения предполагая, что некоторая парабола хорошо приближает значения Нормальные уравнения для имеют в этом случае вид

Отсюда

Если или 1), то в (13) имеется всего одно уравнение относительно неизвестного Его решение

Другими словами, скользящее среднее с равными весами есть частный случай полиномиального сглаживания. Он имеет место, когда степень полинома равна 0 или 1.

Таблица 3.3 (см. скан) КОЭФФИЦИЕНТЫ СГЛАЖИВАЮЩИХ ФОРМУЛ ДЛЯ

Если , то нормальные уравнения принимают вид (см. упр. 7)

Их решением является

В табл. 3.3 приведены значения коэффициентов для и нескольких значений Случай исследован выше, а случай вынесен в упр. 22. Кендалл и Стьюарт (1966, разд. 46.5) приводят коэффициенты для других случаев и обсуждают связанные с ними формулы сглаживания.

Необходимо отметить, что при коэффициент остается неопределенным. При производится подбор полинома степени по точкам. Такой подбор выполняется точно и поэтому Если то скользящее среднее нетривиально, т. е. в него входит несколько значений . В простейшем из таких случаев

Мы убедимся в этом в § 3.4, после того как получим ряд результатов, связанных с последовательностями разностей.

<< Предыдущий параграф Следующий параграф >>
Оглавление