Главная > Математика > Статистический анализ временных рядов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

4.3.4. Решение вопроса о включении тригонометрических слагаемых

Трудной, но весьма существенной является задача о том, какие тригонометрические слагаемые следует включать в циклический тренд. Это задача с несколькими решениями, возникающая также во многих других областях применения регрессионных методов. Однако в данном случае она имеет некоторые особенности. Будем предполагать, что функция тренда содержит членов. Точнее, это возможно, а если четное, а также соответственно или пар тригонометрических членов с периодами или соответственно. При этом мы располагаем оценкой степенями свободы. Пусть под вопросом находится включение в тренд пар тригонометрических членов, тогда как членов уже определенно должны быть включены в тренд. Мы хотим относительно каждой из пар тригонометрических слагаемых решить, равна ли ее амплитуда нулю, т. е. для каждого решить, будет ли Здесь возможны следующие решения:

Эта задача со многими решениями существенно отличается от рассмотренной в разд. 3.2.2 по той причине, что здесь уже не существует такого априорного естественного упорядочения периодов, каковым являлось упорядочение степеней полиномов.

Будем полагать, что о фазах априори ничего не известно и что их значения не представляют для нас. интереса. Отсюда следует, что решающие процедуры должны основываться на статистиках При этом они будут инвариантны относительно преобразований (если четное), или

Будем считать, кроме того, что заранее нельзя отдать предпочтение ни одной из рассматриваемых периодических функций. В связи с этим естественно ограничиться только симметричными процедурами.

Рассмотрим сначала случай, когда известно. Такая задача имеет определенный исторический интерес и является предельной для ряда других случаев. В предположении нормальности статистики или возможно, образуют достаточное множество статистик для параметров или соответственно, Потребуем, чтобы решающие процедуры были инвариантны относительно преобразования (46). (Изменения фаз соответствуют вращениям пар Тогда они должны основываться на статистиках Если то величина

имеет -распределение с 2 степенями свободы. Плотность ее распределения и сама функция распределения равны соответственно

В противном случае имеет нецентральное -распределение с 2 степенями свободы и параметром нецентральности Соответствующая плотность имеет следующий

вид:

где

— бесселева функция первого рода с чисто мнимым аргументом порядка 0. В силу того что выражается степенным рядом с положительными коэффициентами, она является монотонно возрастающей функцией аргумента Поэтому монотонно возрастающая функция от при каждом

Рассмотрим процедуру проверки нулевой гипотезы о том, что величина некоторой амплитуды равна нулю, использующую оценку только этой амплитуды.

Теорема 4.3.1. Равномерно наиболее мощный инвариантный критерий для проверки гипотезы против альтернативы с уровнем значимости имеет критическую область

Доказательство. Вероятность события (51) при нулевой гипотезе равна поскольку функция распределения имеет вид Из фундаментальной леммы Неймана — Пирсона следует, что (51) является критической областью наиболее мощного критерия для проверки гипотезы против любой простой альтернативы, например Обозначим множество, определяемое соотношением (51), через Через А будем обозначать любую другую критическую область с Неравенство (51) эквивалентно неравенству

правая часть которого обозначена для краткости символом

Поэтому

Утверждение теоремы вытекает теперь из того, что неравенство (53) выполняется для всех

Приведенная процедура известна под названием критерия Шустера (Шустер (1898)).

Рассматриваемую задачу со многими решениями можно представить как комбинацию задач, включающих в себя гипотезы об отдельных амплитудах, а именно:

Пусть обозначают области из пространства значений в которых соответственно принимаются гипотезы а области, в которых принимаются гипотезы Эти два множества областей указанного выборочного пространства находятся точно в таком же соответствии, в каком находятся два введенных выше множества областей из. пространства параметров, указанные в (54). Потребуем, чтобы

чтобы вероятность правильного решения не зависела от значений других амплитуд. Будем называть это свойство независимостью от мешающих параметров. Тогда рассуждения, подобные тем, которые были проведены в разд. 3.2.2 (мы их только наметим), показывают, что пересечения имеют вероятности для почти всех наборов неотрицательных значений Пусть равно 1 в области и 0 вне этой области критическая функция; ее можно продолжить до рандомизированной критической функции). Условное математическое ожидание относительно является ограниченной функцией остальных аргументов. Из (55) следует, что математическое ожидание разности последнего и величины тождественно равно нулю, независимо от параметра нецентральности. Искомый результат вытекает теперь из ограниченной полноты семейства нецентральных -распределений. (См. упр. 25 и 26.)

Из сказанного следует, что решение о основывается в действительности только на Если мы привлечем условие симметрии, то все будут равны. Обозначим это общее значение через При данном наилучшая процедура для проверки указана в теореме 4.3.1 (где ). Отметим, что

Если задается значение именно этой вероятности в виде то или

Теорема 4.3.2. Пусть задана вероятность принятия решения о том, что все рассматриваемые амплитуды равны О, когда это в действительности имеет место. Тогда равномерно наиболее мощная симметричная инвариантная процедура выбора положительных амплитуд, не зависящая от мешающих параметров, состоит в том, что решение принимается при

Если все то ошибочным будет решение о том, что хотя бы одно Поскольку, согласно указанной процедуре, решение принимается при вероятность ошибки равна

Эта функция табулирована Дэвисом (1941, табл. 1), у которого соответствуют Указанная процедура в качестве

критерия значимости известна под названием критерия Уолкера [Уолкер Дж. (1914)]. Подобные общие проблемы поиска решений другим методом изучались Леманом (1957). Отметим, что если то

Проблему поиска решения можно поставить и иначе. Предположим, что отличной от нуля может быть самое большее одна амплитуда. Тогда следует рассмотреть гипотезы

Плотность совместного распределения нормированных выборочных амплитуд равна

где самое большее одно положительно. Если, например, верна гипотеза т. е. то отношение правдоподобия для имеет вид

и является монотонно возрастающей функцией от Это наводит на мысль о том, что при больших значениях следовало бы предпочесть гипотезу гипотезе Отношение правдоподобия для выражается формулой

Если то (62) равно Последнее отношение будет больше или меньше 1 в соответствии с тем, больше

или меньше 1 отношение Обратимся к проблеме выбора между гипотезами и

Лемма 4.3.1. Равномерно наиболее мощная симметричная инвариантная процедура выбора между гипотезами состоит в принятии при и принятии при

Доказательство. В данном случае под симметрией понимается симметрия по т. е. симметричны, если в замена на и обратно переводит и обратно. Пусть и пусть два других взаимно дополнительных не пересекающихся симметричных множества. (Мы пренебрегаем множествами вероятности О, такими, как Тогда, из симметрии

Это неравенство выполняется при всех значениях Отсюда следует, что указанная симметричная процедура является равномерно наиболее мощной по

Теорема 4.3.2 и лемма 4.3.1 утверждают, что в указанной выше задаче со многими решениями следует принимать гипотезу если все выборочные амплитуды малы, и принимать гипотезу если максймальная и достаточно большая по величине

амплитуда. Соответствующая процедура симметрична в том смысле, что одновременная перестановка индексов у не изменяет процедуры.

Теорема 4.3.3. Равномерно наиболее мощная симметричная инвариантная решающая процедура выбора только одной из гипотез при заданной вероятности и при условии независимости процедуры от мешающих параметров, состоит в принятии гипотезы если и в противном случае — в принятии гипотезы с индексом удовлетворяющим условию

Доказательство. Пусть полная группа взаимно непересекающихся областей в пространстве значений в которых соответственно принимаются гипотезы отвечающая некоторой произвольной процедуре с Положим и

Тогда и

поскольку в силу симметрии и доказательства леммы 4.3.1

Положим, далее,

При

аналогично доказательству теоремы 4.3.1. Поскольку (65) и (69) выполняются для всех отсюда следует утверждение теоремы.

Теорема 4.3.4. Всякое симметричное байесовское решение состоит в принятии гипотезы при и в противном случае — в принятии гипотезы с индексом удовлетворяющим условию

Доказательство. Всякое байесовское решение определяется [см., например, Т. Андерсон (1958, § 6.6)] соотношениями

где Эти области в силу их определения не пересекаются. Каждая точка на общей границе пары областей (попадание на которую есть событие нулевой вероятности) может быть приписана любой из них. Первая совокупность неравенств равносильна соотношению

левая часть которого является монотонно возрастающей функцией от Определяемая этим соотношением область симметрична тогда и только тогда, когда Поэтому имеет вид, указанный в теореме, и при надлежащем выборе значения

в точности таково же, как и в теореме. Аналогичные замечания справедливы и для остальных областей

Отметим, что эта процедура сводится к критерию значимости, приведенному выше, при следующем дополнительном условии. Если нулевая гипотеза отклоняется, то принимается решение о том, что наибольшая выборочная амплитуда соответствует единственной отличной от нуля теоретической амплитуде. Этот тип задачи исследовался общими методами Карлином и Труаксом (1960), а также Кудо (1960).

Поскольку в данной задаче класс байесовских решений совпадает с классом допустимых решений [см., например, Т. Андерсон (1958, теорема 6.6.4)], то теоремы 4.3.3 и 4.3.4 являются эквивалентными.

Перейдем теперь к более важному случаю неизвестного Надо различать ситуации, когда интересуются оценками некоторых заданных частот и в распоряжении имеется оценка для степенями свободы, полученная независимым образом, и когда оценка для зависит от оцениваемых частот. В первом случае существует оценка такая, что имеет -распределение с степенями свободы независимо от пар коэффициентов а

В первой из указанных ситуаций можно потребовать, чтобы процедура была симметричной и удовлетворяла соотношению (55), т. е. чтобы вероятность решения не зависела от величин других амплитуд, и чтобы вероятность правильного решения о равенстве всех амплитуд нулю не зависела бы от При этом наилучшей для проверки будет процедура, отклоняющая эту гипотезу при (Это вытекает из рассмотрения достаточных статистик, инвариантных относительно преобразований (29), и полноты соответствующего семейства распределений; см. замечание, следующее за Ввиду требования симметрии процедуры положим Тогда

(Эта величина при стремится к При этом с можно выбрать таким образом, чтобы вероятность (73) была равна заранее заданной величине.

Теорема 4.3.5. Если неизвестно, то равномерно наиболее мощная симметричная решающая процедура для выбора положительной амплитуды при заданной вероятности правильного решения о том, что все амплитуды равны нулю и при условии независимости от мешающих параметров состоит в принятии решения при где с определяется так, чтобы вероятность (73) была равна заданной величине.

Если неизвестно, приведенная процедура возможна только в случае существования такой оценки для распределение которой не зависит от тех которые включены в гипотезы. В противном случае невозможно выполнить требование независимости от мешающих параметров. Такая ситуация возникает, когда оказывается нежелательным предполагать равенство нулю даже хотя бы одной пары коэффициентов т. е. когда желательно допускать тригонометрические члены любой частоты (вида Тем не менее иногда можно предполагать, что в действительности отличны от нуля только некоторые из этих коэффициентов, в количестве, не большем некоторого малого числа. Исследуем этот простейший случай подробно.

Предположим, что отличной от нуля может быть только одна из теоретических амплитуд. Задача состоит в том, чтобы решить, какая из гипотез верна. Потребуем, чтобы процедуры были симметричными и чтобы вероятность определялась независимо от неизвестного Будем считать далее, что выборочных амплитуд соответствуют нулевым теоретическим амплитудам. При этом может быть равным и нулю. Таким образом, в тренде остается еще коэффициентов, которые, возможно, и отличны от нуля, но нас не интересуют. (Такая постановка задачи является более общей, чем рассматривавшиеся другими авторами.) Если верна, то и все выборочные коэффициенты, соответствующие другим теоретическим коэффициентам, возможно отличным от нуля, образуют достаточное множество статистик для соответствующих параметров. Отсюда следует, что для почти всех наборов значений и значений других указанных коэффициентов условная вероятность должна быть равна заданной вероятности (см.. упр. 10 гл. 3). Совместная плотность вероятностей значений при

равна

когда верна гипотеза и равна

когда верна гипотеза Мы используем здесь те же методы, что и при доказательстве теоремы 4.3.3. Пересечение областей определяется неравенствами где выбирается таким образом, чтобы условная вероятность совпадала с заданной Пересечение областей определяется неравенствами

Условное совместное распределение значений при условии является - равномерным в области -мерного пространства, определяемой соотношениями Отсюда следует, что условное распределение значений при условии будет равномерным в области Если для каждого положительного то вероятность

не зависит от с и совпадает поэтому с безусловной вероятностью

Теорема 4.3.6. Если неизвестно, то равномерно наиболее мощная симметричная инвариантная решающая процедура выбора среди Ндпри заданной вероятности состоит в принятии если

В противном случае принимается гипотеза с индексом удовлетворяющим соотношению При этом константа выбирается таким образом, чтобы вероятность события (78) при гипотезе равнялась заданной

Вычислим теперь вероятность события, дополнительного к

Обозначим через событие Тогда при гипотезе

[См., например, Феллер (1968, гл. IV, § 1).] Далее, в силу одинаковой распределенности величин имеем

Поскольку то при

Отсюда вытекает, что

где меньшее из двух чисел наибольшее целое число, не превосходящее

Условное распределение значений при условии является равномерным в области значений . Оно совпадаете безусловным распределением величин поскольку условие выполняется автоматически в силу определения Координаты -мерном пространстве являются барицентрическими. Вероятность попадания в произвольное подмножество этого пространства пропорциональна его -мерному объему. Имеем

(Здесь буквой V обозначен объем. - Перев.) Полагая в числителе получаем

Правая часть (85) является отношением объемов двух подобных фигур -мерных подпространств, линейные размеры

которых находятся в отношении Поэтому

Для определения вероятности

рассмотрим

Обозначая получаем для (88) выражение

Отсюда, из тех же соображений, имеем

В общем случае,

Наконец, из этого соотношения и из (83) следует, что

где меньшее из чисел

Это распределение вместе с его таблицами приведено Фишером (1929). Указанная процедура называется критерием Фишера. Геометрическое представление для предлагается в упр. 27. Уиттл (1951) использовал метод характеристических функций; Ирвин (1955) обсуждал различные методы.

Полученный результат относительно вероятности (79) можно обобщить. В этом направлении следующим шагом является вычисление вероятности

(см. скан)

где меньшее из чисел Разложение для использованное здесь, приведено Феллером (1968, гл. IV, § 5). Вообще имеет место следующий результат.

Теорема 4.3.7. Если равномерно распределены в -мерной области то

где равно меньшему из чисел

Стивене (1939) вычислил эту вероятность при решении другой задачи и привел таблицы для Фишер (1940) установил связь между задачей Стивенса и задачей, которую мы рассматриваем. Кроме того, он привел ряд таблиц.

Однако полученный результат имеет ограниченное применение. Например, для указанное распределение дает вероятность того, что два отношения будут больше заданного числа при гипотезе Это соответствует процедуре, в которой гипотеза принимается, если только не найдется по крайней мере двух больших, чем значений Фишер (1940) предположил, что такая процедура могла бы быть приемлемой тогда, когда предполагается, что реальный эффект проявляется скорее всего в двух амплитудах, а не в одной. В наших обозначениях предлагаемую процедуру можно перефразировать следующим образом. Гипотеза принимается за исключением случая, когда выполняются по крайней мере два неравенства . В последнем случае принимается гипотеза Ни с индексами такими, что наибольшие выборочные амплитуды,

Сформулируем теперь байесовскую задачу решения о выборе среди гипотез При этом предположим, что известно. Принимая во внимание симметрию задачи, будем брать априорные вероятности симметричными и

рассматривать гипотезы при симметричных значениях Пусть априорная вероятность гипотезы априорная вероятность события (назовем эту гипотезу априорная вероятность гипотезы состоящей в том, что Мы имеем Поэтому апостериорные вероятности гипотез соответственно пропорциональны величинам

Следовательно, определяется неравенствами

Неравенства (98) эквивалентны неравенствам если с определить соотношением

Поскольку из (100) вытекает, что

Если

то (99) следует из (98). (Если , то (101) принимает вид Так как из (99) вытекает

так что при выполнении

из (99) следует (98). (Если , то (103) есть просто ) Множества определяются неравенствами

В силу определения они не пересекаются. Каждая точка на границе (попадание на границу имеет нулевую вероятность) может быть отнесена к любой области. Неравенства (104) эквивалентны неравенствам Неравенство (105) при равносильно неравенству

Если то (106) эквивалентно неравенству

которое в свою очередь равносильно неравенству где

Если то из вытекает неравенство которое совпадает с неравенством (104). Если отношение монотонно возрастает, а ограничивающая его функция (106) имеет положительную производную Если же отношение монотонно убывает и у ограничивающей его функции (106) производная отрицательна.

Область определяется неравенствами

Если то (110) при равносильно неравенству а при неравенству

Рис. 4.3. (см. скан) Области принятия гипотез когда .

На рис. 4.3 изображены Вид этих областей зависит от знак неравенства в (103) невозможен.) При прямые заменяются кривыми с возрастающим наклоном, а при кривыми с отрицательными тангенсами углов наклона,

Вид таких областей зависит от Отметим, что не существует процедуры, оптимальной равномерно по

Указанные симметричные процедуры могут быть охарактеризованы вероятностями правильного решения Альтернативная постановка состоит в задании вероятностей для некоторого заданного значения и максимизации третьей вероятности для другого заданного значения

Если неизвестно, можно потребовать, чтобы вероятность не зависела от Это требование приводит, как и равнее, к процедурам, связанным с При каждом значении , соответствующие области будут зависеть от Бирнбаум (1959, 1961) использовал такой подход в задаче, частично совпадающей с нашей.

Другой подход [Уиттл (1952)] состоит в следующем. Гипотеза принимается, если где таково, что (92) равно . В противном случае принимается решение о том, что где Затем остальные значений исследуются как бы в новой задаче того же рода, в которой только заменяется на на Эта процедура может выполняться шаг за шагом, пока не будет решено, что остающиеся амплитуды равны нулю. (Геометрическое представление о такой процедуре для можно получить из упр. 28.)

С теоретической точки зрения указанная процедура не вполне удовлетворительна. Выбор определенного значения вероятности дает возможность контролировать вероятность одной из ошибок. Если только одна из амплитуд то вероятность правильного решения возрастает с ростом величины (и это является удовлетворительным). Однако здесь допускается также решение о том, что положительными являются две или более амплитуд. При этом если положительны ровно две амплитуды и одна из них много больше другой, то вероятность решения о том, что эти две амплитуды положительны, в свою очередь может быть высокой. Если же две амплитуды положительны и близки друг другу, то вероятность того, что большая выборочная амплитуда будет столь велика по сравнению с соответствующей суммой, что

она обеспечит принятие решения об отклонении гипотезы может оказаться и не очень большой.

Если гипотеза верна, то распределение значений равномерно на множестве Из геометрических соображений можно заметить, что распределение любых величин при условии, что их сумма равна единице минус величина не включенного в сумму превосходящего константу снова является равномерным (если достаточно велико). Вероятность того, что отношение наибольшей из величин к их сумме будет больше определенного числа, может быть найдена подобным же образом. Однако если гипотеза неверна, то это распределение будет зависеть от значений отличных от нуля. Если какое-то из них отлично от нуля и столь велико, что велика и вероятность того, что соответствующее значение является максимальным, то условное распределение других величин близко к равномерному. Возможны и другие случаи.

Отметим, что для использования процедуры теоремы 4.3.6 вовсе не обязательно отыскивать такое значение чтобы вероятность (92) равнялась требуемой, и затем определять, будет ли максимальное из наблюдаемых значений больше этого числа. Вместо этого можно вычислить (92) для значения равного максимальному из и определить, будет ли вероятность (92) меньше требуемой.

<< Предыдущий параграф Следующий параграф >>
Оглавление