Экономико-математическое моделирование : Уравнения линейной регрессии
Уравнения линейной регрессии
Федеральное агентство по образованию Министерства образования и науки Российской Федерации Государственное образовательное учреждение высшего профессионального образования Филиал Уральского государственного экономического университета г.Березники Кафедра "Математики и естественнонаучных дисциплин" КОНТРОЛЬНАЯ РАБОТА специальность: 080103.65 "Национальная экономика" Выполнил (а) Студент (ка) гр. ЭКФС - 071 Д.А.Вахрушева Проверил Профессор, д.т.н. Б.Н.Щеткин Березники 2010 г Задание 1. 1. В соответствии с МНК найти уравнение линейной регрессии 2. Вычислить точечные оценки для математического ожидания, дисперсии и среднеквадратического отклонения показателей x и y. 3. Найти парный коэффициент линейной корреляции и с доверительной вероятностью p=0,95 проверить его значимость 4. Сделать точечный и интервальный прогноз для случая расходов на рекламу, равных 5 млн.руб. 5. Построить график линии регрессии с нанесением на него опытных данных. Для удобства вычислений параметров системы уравнений составим табл.1. Таблица 1 |
t | xi | yi | xy | x2 | y2 | y-? | (y-?)2 | yi | ei=yi- yx | ei2 | ei-ei-1 | (ei-ei-1)2 | | | | | 1 | 0 | 32,4 | 0 | 0 | 1049,76 | -5,52 | 30,4704 | 32,18 | 0,22 | 0,05 | - | - | -2,25 | 5,06 | 0,68 | | 2 | 0,5 | 32,4 | 16,2 | 0,25 | 1049,76 | -5,52 | 30,4704 | 33,46 | -1,06 | 1,11 | -1,28 | 1,63 | -1,75 | 3,06 | 3,26 | | 3 | 1 | 34,8 | 34,8 | 1 | 1211,04 | -3,12 | 9,7344 | 34,73 | 0,07 | 0,00 | 1,13 | 1,27 | -1,25 | 1,56 | 0,20 | | 4 | 1,5 | 37,1 | 55,65 | 2,25 | 1376,41 | -0,82 | 0,6724 | 36,01 | 1,10 | 1,20 | 1,03 | 1,05 | -0,75 | 0,56 | 2,95 | | 5 | 2 | 38 | 76 | 4 | 1444 | 0,08 | 0,0064 | 37,28 | 0,72 | 0,52 | -0,38 | 0,14 | -0,25 | 0,06 | 1,89 | | 6 | 2,5 | 38,7 | 96,75 | 6,25 | 1497,69 | 0,78 | 0,6084 | 38,58 | 0,12 | 0,01 | -0,60 | 0,36 | 0,25 | 0,06 | 0,31 | | 7 | 3 | 38,6 | 115,8 | 9 | 1489,96 | 0,68 | 0,4624 | 39,83 | -1,23 | 1,51 | -1,35 | 1,82 | 0,75 | 0,56 | 3,19 | | 8 | 3,5 | 39,9 | 139,65 | 12,25 | 1592,01 | 1,98 | 3,9204 | 41,11 | -1,21 | 1,45 | 0,02 | 0,00 | 1,25 | 1,56 | 3,02 | | 9 | 4 | 43,8 | 175,2 | 16 | 1918,44 | 5,88 | 34,5744 | 42,38 | 1,42 | 2,02 | 2,63 | 6,89 | 1,75 | 3,06 | 3,24 | | 10 | 4,5 | 43,5 | 195,75 | 20,25 | 1892,25 | 5,58 | 31,1364 | 43,66 | -0,16 | 0,02 | -1,58 | 2,48 | 2,25 | 5,06 | 0,36 | | Итого | 22,5 | 379,2 | 905,8 | 71,25 | 14521,3 | 0 | 142,056 | 379,20 | 0,00 | 7,90 | -0,38 | 15,64 | | 20,63 | 19,1 | | среднее | 2,25 | 37,92 | 90,58 | 7,125 | 1452,13 | | 14,2056 | 37,92 | | 0,79 | | | | | | | ? | 1,44 | 3,77 | | | | | | | | | | | | | | | ?2 | 2,06 | 14,20 | | | | | | | | | | | | | | | yp | 5 | 44,93 | | | | | | | | | | | | | | | |
1. Пример расчета среднего значения: Построение уравнения регрессии сводятся к оценке ее параметров. Для оценки параметров регрессии, линейных по параметрам, используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических yx минимальна т.е Для линейных уравнений, решается следующая система уравнений: Исходя из таблицы 1, система уравнений с численными значениями параметров имеет вид: Решим систему уравнения по правилу Крамера: Определим коэффициенты регрессии a и b: Также можно воспользоваться готовыми формулами, которые вытекают системы: Уравнение регрессии имеет следующий вид: yi = 32,18+2,55x 2. Вычисление среднеквадратического отклонения: 3.Рассчитаем линейный коэффициент парной корреляции: Или Значение коэффициентов парной корреляции лежит в интервале от -1 до +1. его положительное значение свидетельствует о прямой связи. Связь считается достаточно сильной, т.к. коэффициент корреляции по абсолютной величине превышает 0,7. Рассчитаем коэффициент детерминации. Он показывает долю вариации результативного признака, находящего под воздействием изучаемых факторов. Или Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчетные) значения yi. Найдем величину средней ошибки аппроксимации (расчеты представлены в таблице 1), которая показывает среднее отклонение расчетных значений от фактических. Допустимый предел ее значений 8-10%. Рассчитаем F-критерий Фишера, применяемый для оценки качества уравнения регрессии. Выполняется сравнение Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Если табличное значение меньше расчетного, т.е. признается статистическая значимость и надежность характеристик, уравнение регрессии следует признать адекватным. Рассчитаем стандартную ошибку: Рассчитаем t-критерий Стьюдента, применяемый для оценки статистической значимости коэффициентов регрессии и корреляции. Проверка статистической значимости коэффициентов: Коэффициент корреляции существенно отличен от нуля - это значит, что значения коэффициентов сформировались под влиянием систематически действующего фактора х. Зависимость является значимой и достоверной. Определим случайные ошибки: тогда Рассчитаем доверительный интервал для a и b. Для этого определим предельную ошибку для каждого показателя: Доверительные интервалы: 4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение фактора составит , тогда прогнозное значение результата будет Ошибка прогноза составит: Предельная ошибка прогноза: Доверительный интервал прогноза: 5. Построим график линии регрессии с нанесением на него опытных данных Рис. 1. График линии регрессии Задание №2 Имеются данные о доли расходов на товары длительного пользования уi от среднемесячного дохода семьи xi. Предполагается, что эта зависимость носит нелинейный характер . Необходимо: 1. Найти уравнение нелинейной гиперболической регрессии . 2. Найти парный коэффициент корреляции и с доверительной вероятностью проверить его значимость. Таблица 2 |
i | xi | yi | Xi=1/xi | Xi2 | Xi yi | ?i | ei=yi- ?i | ei2 | yi-? | (yi-?)2 | | 1 | 2 | 29,7 | 0,5000 | 0,25 | 14,85 | 29,11 | 0,59 | 0,35 | 6,49 | 42,12 | | 2 | 2,5 | 26,3 | 0,4000 | 0,16 | 10,52 | 26,56 | -0,26 | 0,07 | 3,09 | 9,55 | | 3 | 3 | 24,8 | 0,3333 | 0,11 | 8,27 | 24,85 | -0,05 | 0,00 | 1,59 | 2,53 | | 4 | 3,5 | 23,5 | 0,2857 | 0,08 | 6,71 | 23,63 | -0,13 | 0,02 | 0,29 | 0,08 | | 5 | 4 | 22,3 | 0,2500 | 0,06 | 5,58 | 22,72 | -0,41 | 0,17 | -0,91 | 0,83 | | 6 | 4,5 | 21,7 | 0,2222 | 0,05 | 4,82 | 22,00 | -0,30 | 0,09 | -1,51 | 2,28 | | 7 | 5 | 21,5 | 0,2000 | 0,04 | 4,30 | 21,43 | 0,07 | 0,00 | -1,71 | 2,92 | | 8 | 5,5 | 19 | 0,1818 | 0,03 | 3,45 | 20,97 | -1,97 | 3,87 | -4,21 | 17,72 | | 9 | 6 | 20,5 | 0,1667 | 0,03 | 3,42 | 20,58 | -0,08 | 0,01 | -2,71 | 7,34 | | 10 | 6,5 | 22,8 | 0,1538 | 0,02 | 3,51 | 20,25 | 2,55 | 6,49 | -0,41 | 0,17 | | итого | 42,5 | 232,1 | 2,6936 | 0,839131 | 65,4271 | 232,10 | 0,00 | 11,08 | 0 | 85,55 | | среднее | 4,25 | 23,21 | 0,27 | 0,083913 | 6,54 | 23,21 | | 1,11 | 0,00 | 8,55 | | |
1. Уравнение равносторонней гиперболы имеет вид: произведем линеаризацию модели путем замены X=1/x. В результате получим линейное уравнение . Рассчитаем его параметры по данным таблицы 2. Полученные результаты заносим в таблицу. Применяя МНК к уравнению , получим систему нормальных уравнений: Исходя из таблицы 1, система уравнений с численными значениями параметров имеет вид: Решим систему уравнения по правилу Крамера: Определим коэффициенты регрессии a и b: Уравнение регрессии имеет следующий вид: 2.Рассчитаем линейный коэффициент парной корреляции: Связь между показателем y и фактором x очень тесная. Проверим значимость индекса корреляции с помощью F-критерия Фишера. Наблюдаемое значение статистики определяется по формуле: По таблице критических точек F-распределения Фишера-Снедекора находим табличное значение Fтабл. F > Fтабл = 5,32 для ?=0,05, k1=m=1, k2=n-m-1=8 51,22 > 5,32 Индекс корреляции значим, т.к. F > Fтабл. Задание №3 Исследуется зависимость месячного расхода семьи на продукты питания zi. , тыс.р. от месячного дохода на одного члена семьи xi тыс.р. и от размера семью yi , чел. Необходимо: 1. В соответствии с методом наименьших квадратов найти уравнение линейной регрессии . 2. Найти парные коэффициенты корреляции . 3. С доверительной вероятностью р=0,95 проверить коэффициенты корреляции на значимость. 4. Вычислить индекс множественной корреляции и проверить с доверительной вероятностью его статистическую значимость. 1. Согласно МНК параметры регрессии уравнения находятся по формуле , где матрица значений объясняющих переменных; - матрица столбец значений зависимой переменной; - матрица-столбец параметров линейного уравнения регрессии В нашем случае Матрица XTX представляет собой матрицу сумм первых степеней, квадратов и произведений n наблюдений объясняющих переменных: Таблица 3 |
t | x | y | z | x2 | y2 | xy | | 1 | 2 | 1 | 2,40 | 4 | 1 | 2 | | 2 | 3 | 1 | 3,10 | 9 | 1 | 3 | | 3 | 4 | 1 | 3,40 | 16 | 1 | 4 | | 4 | 2 | 2 | 3,70 | 4 | 4 | 4 | | 5 | 3 | 2 | 4,00 | 9 | 4 | 6 | | 6 | 4 | 2 | 4,20 | 16 | 4 | 8 | | 7 | 3 | 3 | 4,50 | 9 | 9 | 9 | | 8 | 4 | 3 | 4,70 | 16 | 9 | 12 | | 9 | 5 | 3 | 6,00 | 25 | 9 | 15 | | 10 | 3 | 4 | 5,90 | 9 | 16 | 12 | | 11 | 4 | 4 | 6,30 | 16 | 16 | 16 | | 12 | 5 | 4 | 6,40 | 25 | 16 | 20 | | 13 | 2 | 5 | 6,30 | 4 | 25 | 10 | | 14 | 3 | 5 | 6,50 | 9 | 25 | 15 | | 15 | 4 | 5 | 7,20 | 16 | 25 | 20 | | итого | 51 | 45 | 74,6 | 187 | 165 | 156 | | среднее | 3,40 | 3,00 | 4,97 | | | | | |
Обозначим через B=XTX. Тогда матрица B-1 определяется по формуле , где - определитель матрицы B, - матрица составленная из алгебраических дополнений к элементам матрицы B. - транспонированная матрица к матрице . Получаем: = 15•(187•165-1562)-51•(51•165-45•156)+45•(51•156-45•187)=5985 Таким образом, матрица имеет вид: а матрица примет вид: Для матрицы B-1 получаем: отсюда матрица Окончательно для матрицы А получаем: Следовательно: c=0,81 a=0,41 b=0,923 Уравнение множественной регрессии имеет вид: 2. Рассчитаем парные коэффициенты корреляции - "исправленные" среднеквадратические отклонения величин x,y и z Таблица 4 |
t | x | y | z | x-? | y-? | z-? | (x-?)2 | (y-?)2 | (z-?)2 | (x-?)* (z-?) | (y-?)* (z-?) | (x-?)* (y-?) | xz | yz | | 1 | 2 | 1 | 2,40 | -1,40 | -2,00 | -2,57 | 1,96 | 4,00 | 6,62 | 3,60 | 5,15 | 2,8 | 4,8 | 2,4 | | 2 | 3 | 1 | 3,10 | -0,40 | -2,00 | -1,87 | 0,16 | 4,00 | 3,51 | 0,75 | 3,75 | 0,8 | 9,3 | 3,1 | | 3 | 4 | 1 | 3,40 | 0,60 | -2,00 | -1,57 | 0,36 | 4,00 | 2,48 | -0,94 | 3,15 | -1,2 | 13,6 | 3,4 | | 4 | 2 | 2 | 3,70 | -1,40 | -1,00 | -1,27 | 1,96 | 1,00 | 1,62 | 1,78 | 1,27 | 1,4 | 7,4 | 7,4 | | 5 | 3 | 2 | 4,00 | -0,40 | -1,00 | -0,97 | 0,16 | 1,00 | 0,95 | 0,39 | 0,97 | 0,4 | 12 | 8 | | 6 | 4 | 2 | 4,20 | 0,60 | -1,00 | -0,77 | 0,36 | 1,00 | 0,60 | -0,46 | 0,77 | -0,6 | 16,8 | 8,4 | | 7 | 3 | 3 | 4,50 | -0,40 | 0,00 | -0,47 | 0,16 | 0,00 | 0,22 | 0,19 | 0,00 | 0 | 13,5 | 13,5 | | 8 | 4 | 3 | 4,70 | 0,60 | 0,00 | -0,27 | 0,36 | 0,00 | 0,07 | -0,16 | 0,00 | 0 | 18,8 | 14,1 | | 9 | 5 | 3 | 6,00 | 1,60 | 0,00 | 1,03 | 2,56 | 0,00 | 1,05 | 1,64 | 0,00 | 0 | 30 | 18 | | 10 | 3 | 4 | 5,90 | -0,40 | 1,00 | 0,93 | 0,16 | 1,00 | 0,86 | -0,37 | 0,93 | -0,4 | 17,7 | 23,6 | | 11 | 4 | 4 | 6,30 | 0,60 | 1,00 | 1,33 | 0,36 | 1,00 | 1,76 | 0,80 | 1,33 | 0,6 | 25,2 | 25,2 | | 12 | 5 | 4 | 6,40 | 1,60 | 1,00 | 1,43 | 2,56 | 1,00 | 2,04 | 2,28 | 1,43 | 1,6 | 32 | 25,6 | | 13 | 2 | 5 | 6,30 | -1,40 | 2,00 | 1,33 | 1,96 | 4,00 | 1,76 | -1,86 | 2,65 | -2,8 | 12,6 | 31,5 | | 14 | 3 | 5 | 6,50 | -0,40 | 2,00 | 1,53 | 0,16 | 4,00 | 2,33 | -0,61 | 3,05 | -0,8 | 19,5 | 32,5 | | 15 | 4 | 5 | 7,20 | 0,60 | 2,00 | 2,23 | 0,36 | 4,00 | 4,96 | 1,34 | 4,45 | 1,2 | 28,8 | 36 | | Итого | 51 | 45 | 74,6 | 0,00 | 0,00 | 0,00 | 13,6 | 30 | 30,82933 | 8,36 | 28,9 | 3 | 262 | 252,7 | | среднее | 3,4 | 3 | 4,97 | 0,00 | 0,00 | 0,00 | 0,91 | 2,00 | 2,06 | 0,56 | 1,93 | 0,20 | | |
По данным таблицы 4 находим: Матрица парных коэффициентов корреляции имеет вид: 3. Проверим коэффициенты корреляции на значимость с доверительной вероятностью p=0,95, т.е. на уровне значимость ?=1-p=0,05. Определим случайные ошибки коэффициентов корреляции: Определяем расчетные значения t-критерия Стьюдента: По таблице распределения Стьюдента определяем критическое значение t-статистики при ?=1-p=0,05 и числе степеней свободы n-2=15-2=13: tкр=2,16. Сравнивая расчетные значения t-критерия с критическим значением, делаем вывод, что значимым является только коэффициент парной корреляции ryz, т.к. для него 4. Вычислим индекс множественной корреляции R через стандартизированные ?-коэффициенты множественной регрессии и парные коэффициенты корреляции по формулам: Индекс множественной корреляции: Задание 4 Дана выборка курса биржевой стоимости акции некоторого предприятия за 12 месяцев. 1 Найти коэффициенты автокорреляции со смещением на 1,2,3 и 4 месяца. 2. Проверить найденные коэффициенты автокорреляции на значимость с доверительной вероятностью . 3. Построить коррелограмму. 4. Построить аддитивную модель временного ряда. Коэффициенты автокорреляции со смещением (лагом) на k периодов находятся по формуле: 1.1. Рассчитаем коэффициент автокорреляции со смещением на 1 месяц. Для этого составим расчетную таблицу 5 Таблица 5 |
месяц | yt | yt+1 | yt2 | y2t+1 | yt •yt+1 | | 1 | 74,4 | 73,2 | 5535,36 | 5358,24 | 5446,08 | | 2 | 73,2 | 74,3 | 5358,24 | 5520,49 | 5438,76 | | 3 | 74,3 | 79,9 | 5520,49 | 6384,01 | 5936,57 | | 4 | 79,9 | 78,7 | 6384,01 | 6193,69 | 6288,13 | | 5 | 78,7 | 79,7 | 6193,69 | 6352,09 | 6272,39 | | 6 | 79,7 | 84,1 | 6352,09 | 7072,81 | 6702,77 | | 7 | 84,1 | 84,3 | 7072,81 | 7106,49 | 7089,63 | | 8 | 84,3 | 85,4 | 7106,49 | 7293,16 | 7199,22 | | 9 | 85,4 | 89,3 | 7293,16 | 7974,49 | 7626,22 | | 10 | 89,3 | 89,6 | 7974,49 | 8028,16 | 8001,28 | | 11 | 89,6 | 91 | 8028,16 | 8281 | 8153,6 | | Итого | 892,9 | 909,5 | 72818,99 | 75564,63 | 74154,65 | | |
1.2. Рассчитаем коэффициент автокорреляции со смещение на два месяца. Для этого составим таблицу 6 Таблица 6 |
месяц | yt | yt+2 | yt2 | y2t+2 | yt •yt+2 | | 1 | 74,4 | 74,3 | 5535,36 | 5520,49 | 5527,92 | | 2 | 73,2 | 79,9 | 5358,24 | 6384,01 | 5848,68 | | 3 | 74,3 | 78,7 | 5520,49 | 6193,69 | 5847,41 | | 4 | 79,9 | 79,7 | 6384,01 | 6352,09 | 6368,03 | | 5 | 78,7 | 84,1 | 6193,69 | 7072,81 | 6618,67 | | 6 | 79,7 | 84,3 | 6352,09 | 7106,49 | 6718,71 | | 7 | 84,1 | 85,4 | 7072,81 | 7293,16 | 7182,14 | | 8 | 84,3 | 89,3 | 7106,49 | 7974,49 | 7527,99 | | 9 | 85,4 | 89,6 | 7293,16 | 8028,16 | 7651,84 | | 10 | 89,3 | 91 | 7974,49 | 8281 | 8126,3 | | Итого | 803,3 | 836,3 | 64790,83 | 70206,39 | 67417,69 | | |
1.3. Рассчитаем коэффициент автокорреляции со смещением на 3 месяца. Составим таблицу 7 Таблица 7 |
yt | yt+3 | yt2 | y2t+3 | yt •yt+3 | | 74,4 | 79,9 | 5535,36 | 6384,01 | 5944,56 | | 73,2 | 78,7 | 5358,24 | 6193,69 | 5760,84 | | 74,3 | 79,7 | 5520,49 | 6352,09 | 5921,71 | | 79,9 | 84,1 | 6384,01 | 7072,81 | 6719,59 | | 78,7 | 84,3 | 6193,69 | 7106,49 | 6634,41 | | 79,7 | 85,4 | 6352,09 | 7293,16 | 6806,38 | | 84,1 | 89,3 | 7072,81 | 7974,49 | 7510,13 | | 84,3 | 89,6 | 7106,49 | 8028,16 | 7553,28 | | 85,4 | 91 | 7293,16 | 8281 | 7771,4 | | 714 | 762 | 56816,34 | 64685,9 | 60622,3 | | |
=1.4. Рассчитаем коэффициент автокорреляции со смещением на 4 месяца. Составим таблицу 8. Таблица 8 |
месяц | yt | yt+4 | yt2 | y2t+4 | yt •yt+4 | | 1 | 74,4 | 78,7 | 5535,36 | 6193,69 | 5855,28 | | 2 | 73,2 | 79,7 | 5358,24 | 6352,09 | 5834,04 | | 3 | 74,3 | 84,1 | 5520,49 | 7072,81 | 6248,63 | | 4 | 79,9 | 84,3 | 6384,01 | 7106,49 | 6735,57 | | 5 | 78,7 | 85,4 | 6193,69 | 7293,16 | 6720,98 | | 6 | 79,7 | 89,3 | 6352,09 | 7974,49 | 7117,21 | | 7 | 84,1 | 89,6 | 7072,81 | 8028,16 | 7535,36 | | 8 | 84,3 | 91 | 7106,49 | 8281 | 7671,3 | | Итого | 628,6 | 682,1 | 49523,18 | 58301,89 | 53718,37 | | |
Проверим значимость всех коэффициентов автокорреляции. Значимость коэффициентов автокорреляции принято проверять с помощью двух критериев: критерия стандартной ошибки и Q-критерия Бокса-Пирса. Построим доверительный интервал коэффициента автокорреляции по формуле: , где n - число пар наблюдений временного ряда для r1 (объем выборки составляет: n-1=12-1=11) для r2 (объем выборки составляет: n-2=12-2=10) для r3 (объем выборки составляет: n-3=12-3=9) для r4 (объем выборки составляет: n-4=12-4=8) Рассчитанные значения коэффициентов автокорреляции: r1=0,93 r2=0,90 r3=0,995 r4=0,89 не попадают в рассчитанные доверительные интервалы. Тогда делаем вывод, что данные наблюдения показывают наличие автокорреляции 1,2,3,4 порядков. Проверим значимость всей группы коэффициентов автокорреляции с помощью Q-критерия Бокса-Пирса. Для уровня значимости ?=0,05 и числа степеней свободы k=4 находим по таблице критических точек распределения ?2, ?2кр=(?=0,05;k=4)=9,5 Так как Qн> ?2кр, то в целом, вся группа коэффициентов для лагов, не превосходящих m=4, считается значимой. 3. Построим коррелограмму для исходного временного ряда. Рис. 2. График автокорреляционной функции r(k) По коэффициенту автокорреляции можно судить о наличии линейной или близкой к линейной тенденции. Рис. 3. График наблюдаемых значений исходного временного ряда На рисунке 3 по графику наблюдаемых значений временного ряда наглядно видно наличие возрастающей тенденции. Поэтому во временном ряду возможно существование линейного тренда. Высокие значения коэффициентов автокорреляции 1,2,3 порядков, а также значимость всей группы коэффициентов автокорреляции, свидетельствуют, о том, что ряд содержит линейную тенденцию. Высокое значение коэффициента автокорреляции 3 порядка свидетельствуют о том, что ряд содержит циклические (сезонные) колебания с периодичностью в 3 месяца. Поскольку амплитуда колебаний приблизительно постоянна, выбираем аддитивную модель временного ряда. Рассчитаем компоненты выбранной модели: 1. Проведем выравнивание исходных уровней ряда методом скользящей средней 2. Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда и уровнями скользящей средней. Используем эти значения для оценки сезонной компоненты S (табл. 10). Для этого найдем средние за каждый месяц по всем кварталам оценки сезонной компоненты S1. Таблица 9 |
t | yt | | | | месяц | стоимость акций (руб.) | простая 3-х членная скользящая средняя | оценка сезонной компоненты | | 1 | 74,4 | - | - | | 2 | 73,2 | 73,97 | -0,77 | | 3 | 74,3 | 75,80 | -1,50 | | 4 | 79,9 | 77,63 | 2,27 | | 5 | 78,7 | 79,43 | -0,73 | | 6 | 79,7 | 80,83 | -1,13 | | 7 | 84,1 | 82,70 | 1,40 | | 8 | 84,3 | 84,60 | -0,30 | | 9 | 85,4 | 86,33 | -0,93 | | 10 | 89,3 | 88,10 | 1,20 | | 11 | 89,6 | 89,97 | -0,37 | | 12 | 91 | - | - | | |
Таблица 10 |
Показатель | номер месяца | | квартал | 1 | - | -0,77 | -1,5 | | | 2 | 2,27 | -0,73 | -1,13 | | | 3 | 1,4 | -0,3 | -0,93 | | | 4 | 1,2 | -0,37 | - | | итого за i-тый месяц/за весь год | 4,87 | -2,17 | -3,56 | | средняя оценка сезонной компоненты для i-того месяца | 1,62333 | -0,72333 | -1,18667 | | Скорректированная сезонная компонента | 1,71889 | -0,62777 | -1,09112 | | |
Для данной модели получаем 1,62333-0,72333-1,18667=-0,28667 Корректирующий коэффициент определится по формуле ?== -0,28667/3= -0,09556 Скорректированные значения сезонной компоненты определяются как разность между ее средней оценкой и корректирующим коэффициентом ?: ? , i=1,2,3. Проверяем условие равенства нулю суммы значений сезонной компоненты S1+S2+S3=0 1,71889-0,62777-1,09112=0 Окончательно для сезонной компоненты получены следующие значения: за 1 месяц S1=1,71889; за 2 месяц S2=-0,62777; за 3 месяц S3=1,09112; Полученные данные заносим в таблицу 11 для соответствующих месяцев года. 3. Элиминируем влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного ряда: T+E=Y-S Таблица 11 |
t | yt | Si | T+E= yt-Si | T | T+S | E= yt- -(T+ Si) | E2 | yt-?t | (yt-?t)2 | | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | | 1 | 74,4 | 1,71889 | 72,68111 | 72,25 | 73,96889 | 0,43111 | 0,185856 | -7,5917 | 57,6334 | | 2 | 73,2 | -0,62777 | 73,82777 | 74,02 | 73,39223 | -0,19223 | 0,036952 | -8,7917 | 77,2934 | | 3 | 74,3 | -1,09112 | 75,39112 | 75,79 | 74,69888 | -0,39888 | 0,159105 | -7,6917 | 59,1617 | | 4 | 79,9 | 1,71889 | 78,18111 | 77,57 | 79,28889 | 0,61111 | 0,373455 | -2,0917 | 4,3751 | | 5 | 78,7 | -0,62777 | 79,32777 | 79,34 | 78,71223 | -0,01223 | 0,00015 | -3,2917 | 10,8351 | | 6 | 79,7 | -1,09112 | 80,79112 | 81,11 | 80,01888 | -0,31888 | 0,101684 | -2,2917 | 5,2517 | | 7 | 84,1 | 1,71889 | 82,38111 | 82,88 | 84,59889 | -0,49889 | 0,248891 | 2,1083 | 4,4451 | | 8 | 84,3 | -0,62777 | 84,92777 | 84,65 | 84,02223 | 0,27777 | 0,077156 | 2,3083 | 5,3284 | | 9 | 85,4 | -1,09112 | 86,49112 | 86,42 | 85,32888 | 0,07112 | 0,005058 | 3,4083 | 11,6167 | | 10 | 89,3 | 1,71889 | 87,58111 | 88,19 | 89,90889 | -0,60889 | 0,370747 | 7,3083 | 53,4117 | | 11 | 89,6 | -0,62777 | 90,22777 | 89,96 | 89,33223 | 0,26777 | 0,071701 | 7,6083 | 57,8867 | | 12 | 91 | -1,09112 | 92,09112 | 91,72 | 90,62888 | 0,37112 | 0,13773 | 9,0083 | 81,1501 | | Итого | 983,9 | | | 983,9 | | 0,00 | 1,768486 | 0,0000 | 428,3892 | | ср.знач | 81,9917 | | |
4. Определим трендовую компоненту T данной модели. Проведем аналитическое выравнивание ряда (T+E) (гр.4 табл.11) с помощью линейного тренда. Для удобства обозначим ряд (T+E) как W: W=T+E Линейная модель тенденции временного ряда W имеет вид Согласно МНК параметры модели линейного тренда определяются из системы нормальных уравнений: Вычислим в таблице 12 необходимые данные: Таблица 12 |
t | wt | t2 | twt | | | 1 | 72,681 | 1 | 72,681 | 72,25 | | 2 | 73,828 | 4 | 147,656 | 74,02 | | 3 | 75,391 | 9 | 226,173 | 75,79 | | 4 | 78,181 | 16 | 312,724 | 77,57 | | 5 | 79,328 | 25 | 396,64 | 79,34 | | 6 | 80,791 | 36 | 484,746 | 81,11 | | 7 | 82,381 | 49 | 576,667 | 82,88 | | 8 | 84,928 | 64 | 679,424 | 84,65 | | 9 | 86,491 | 81 | 778,419 | 86,42 | | 10 | 87,581 | 100 | 875,81 | 88,19 | | 11 | 90,228 | 121 | 992,508 | 89,96 | | 12 | 92,091 | 144 | 1105,092 | 91,72 | | Итого 78 | 983,9 | 650 | 6648,54 | 983,9 | | |
Система нормальных уравнений имеет вид: Решим систему уравнения по правилу Крамера: Определим коэффициенты регрессии a и b: Линейная модель тенденции временного ряда имеет вид: Подставив в это уравнение значения t=1,2,3,…,12, получим выровненные для каждого момента времени (табл.12) или в старых обозначениях, уровни (T+E) (гр.5 табл.11). 5. Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавляем к уровням T значения сезонной компоненты для соответствующих месяцев (гр.6 табл.11) 6. Расчет ошибки производится по формуле Значения абсолютных ошибок приведены в гр.7 табл.11. Для выбора лучшей модели можно использовать сумму квадратов абсолютных ошибок, которая в нашем случае равна 1,768 (гр.8 табл.11). Средний уровень исходного временного ряда подсчитывается по гр.2 табл.11: Рассчитаем отклонения уровней исходного ряда от его среднего для каждого месяца (гр.9 табл.11). Рассчитаем сумму квадратов отклонений уровней ряда от его среднего уровня (гр.10 табл.11), которая равна 428,389. По аналогии с моделью регрессии для оценки качества построенной модели составляем величину 1-(1,768486/428,3892)=0,9959 или 99,59% Следовательно, можно утверждать, что аддитивная модель объясняется 99,59% общей вариации уровней временного ряда стоимости акции за последние 12 месяцев.
|