Экономико-математическое моделирование : Эконометрика
Эконометрика
14 Задание I По территории Северного, Северо-Западного и Центрального районов известны данные за ноябрь 1997 г. |
Район | Денежные доходы на душу населения,тыс. руб., x | Потребительские расходы на душу населения, тыс. руб.,y | | Респ. Карелия | 913 | 596+N | | Респ. Коми | 1095 | 417+N | | Архангельская обл. | 606 | 354+N | | Вологодская обл. | 876 | 526+N | | Мурманская обл. | 1314 | 934+N | | Ленинградская обл. | 593 | 412+N | | Новгородская обл. | 754 | 525+N | | Псковская обл. | 528 | 367+N | | Брянская обл. | 520 | 364+N | | Владимирская обл. | 539 | 336+N | | Ивановская обл. | 540 | 409+N | | Калужская обл. | 682 | 452+N | | Костромская обл. | 537 | 367+N | | Московская обл. | 589 | 328+N | | Орловская обл. | 626 | 460+N | | Рязанская обл. | 521 | 380+N | | Смоленская обл. | 626 | 439+N | | Тверская обл. | 521 | 344+N | | Тульская обл. | 658 | 401+N | | Ярославская обл. | 746 | 514+N | | |
1. Постройте поле корреляции. 2. Рассчитайте параметры уравнений, в соответствии с вариантом задания, парной регрессии. Запишите уравнения в явном виде. 3. Оцените тесноту связи с помощью показателей корреляции и детерминации (для каждого уравнения). 4. Оцените значимость коэффициентов регрессий с помощью t-критерия Стьюдента и доверительных интервалов. 5. Оцените с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования. 6. По значениям характеристик, рассчитанных в пп. 3,4, 5, выберите лучшее уравнение регрессии. 7. По лучшему уравнению рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 50 % от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости б=0,05. Задание II Изучается зависимость средней ожидаемой продолжительности жизни от нескольких факторов по данным за 1995 г. |
Страна | У | X1 | X2 | X3 | X4 | | Белоруссия | 70+N | 15,6 | 0,2 | 0,2 | 13+N | | Перу | 66+N | 14,0 | 2,0 | 3,1 | 47+N | | Тайланд | 69+N | 28,0 | 0,9 | 1,3 | 35+N | | Панама | 73+N | 22,2 | 1,7 | 2,4 | 23+N | | Турция | 67+N | 20,7 | 1,7 | 2,1 | 48+N | | Польша | 70+N | 20,0 | 0,3 | 0,6 | 14+N | | Словакия | 72+N | 13,4 | 0,3 | 0,7 | 11+N | | Венесуэла | 71+N | 29,3 | 2,3 | 3,0 | 23+N | | ЮАР | 64+N | 18,6 | 2,2 | 2,4 | 50+N | | Мексика | 72+N | 23,7 | 1,9 | 2,8 | 33+N | | Мавритания | 71+N | 49,0 | 1,3 | 1,8 | 16+N | | Бразилия | 67+N | 20,0 | 1,5 | 1,6 | 44+N | | Тринидад | 72+N | 31,9 | 0,8 | 1,8 | 13+N | | Малайзия | 71+N | 33,4 | 2,4 | 2,7 | 12+N | | Чили | 72+N | 35,3 | 1,5 | 2,1 | 12+N | | Уругвай | 73+N | 24,6 | 0,6 | 1,0 | 18+N | | |
Принятые в таблице обозначения: Y - средняя ожидаемая продолжительность жизни при рождении, лет; X1 - ВВП в паритетах покупательной способности; X2 - темпы прироста населения по сравнению с предыдущим годом, %; X3 - темпы прироста рабочей силы по сравнению с предыдущим годом, %; X4 - коэффициент младенческой смертности, %. 1. Постройте уравнение множественной регрессии в линейной форме с полным набором факторов. Оцените параметры модели. 2. Оцените статистическую значимость уравнения регрессии с помощью критерия Фишера. 3. Постройте матрицу парных коэффициентов корреляции. Установите, какие факторы мультиколлинеарны, удалите зависимые факторы . 4. Постройте уравнение регрессии со статистически значимыми факторами. Оцените статистическую значимость нового уравнения регрессии с помощью критерия Фишера. Выполнение задания: Построим поле корреляции для представленных значений: Необходимо подобрать соответствующую линию регрессии, для чего рассмотрим линейный и гиперболический вид парной регрессии, проведем анализ данных. 1. Линейная регрессия. Для расчета параметров a и b линейной регрессии y, решаем систему нормальных уравнений относительно a и b: Итак, получим, что коэффициенты равны a=105,82 и b=0,54 Уравнение регрессии: a=105,82 + 0,54*х. С увеличением доли денежных доходов в общей сумме среднедушевого денежного дохода на 1 руб. потребительские расходы увеличатся в среднем 0,54 руб. Рассчитаем линейный коэффициент парной корреляции: Полученное значение равно rxy=0.84, что говорит о сильной тесноте связи между показателями. Определим коэффициент детерминации: Получим значение = 0,71. Это говорит о том, что вариация результата на 71% объясняется вариацией фактора х, а в остальных случаях (29%) влиянием других, неучтенных факторов в модели. В результате можно сделать вывод о том, что модель построена достаточно верно, и ошибки спецификации незначительны. Подставляя в уравнение регрессии фактические значения x, определим расчетные значения yx. Найдем величину средней ошибки аппроксимации В: Эта величина составляет 9,21%. Качество построенной модели оценивается как достаточно хорошее, так как полученное значение попадает в границы 8-10%. Оценку статической значимости параметров регрессии проведем с помощью t-статистики Стьюдента и путем расчета доверительного интервала каждого из показателей. Выдвигаем гипотезу Н0 о статистически незначимом отличии показателей от нуля a=b=rxy=0. tтабл для числа степеней свободы df=n-2=20-2=18 и =0,05 составит 2,1. Определим случайные ошибки ma, mb, mrxy. ma=58,67; mb=0,08. Сравним фактические значения t-статистики и табличные значения: ta=1,80< tтабл tb=6,59> tтабл Следовательно, гипотеза Н0 принимается для параметра а и отклоняется параметр b,следовательно параметр а случайно сформирован и статистически не значим, а параметр b признается статистически оправданным и не случайно сформированным. Рассчитаем доверительный интервал для a и b: Доверительные интервалы будут равны: a min = - 17,43 a max = 229,08 b min = 0,37 Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью p=1-=0,95 параметр a и b, находится в указанных границах, но при этом границы параметра a переходят через ноль, т.о. параметр a является статистически незначимым и не существенно отличается от нуля. Рассчитаем F критерий: Получим величину Fфакт=43,48. Сравнив данное значение с табличным Fтабл=4,41, то Fфакт > Fтабл, делаем вывод о том, что полученное значение указывает на необходимость отклонить гипотезу Н0 о случайной природе выявленной зависимости и статической незначимости параметров уравнения и показателя тесноты связи, и признать надежность результатов и оправданный выбор модели. 2. Степная регрессия. Уравнение степной регрессии y = axb лицензируется логарифмированием. Прологарифмировав данную функцию, получим: ln y = ln a +bln x - ln или, производя обозначения y1 = a1 + bx1 + 1, где y1 = ln a; a1 = ln a; x1 = ln x; 1 = ln . Параметр b определяется непосредственно из системы, а параметр a - косвенным путём: a = ea1. Данные для расчёта имеют следующий вид: |
x | y | x1 | y1 | | 913 | 625 | 6,816736 | 6,437752 | | 1095 | 446 | 6,99851 | 6,100319 | | 606 | 383 | 6,40688 | 5,948035 | | 876 | 555 | 6,775366 | 6,318968 | | 1314 | 963 | 7,180831 | 6,870053 | | 593 | 441 | 6,385194 | 6,089045 | | 754 | 554 | 6,625392 | 6,317165 | | 528 | 396 | 6,269096 | 5,981414 | | 520 | 393 | 6,253829 | 5,97381 | | 539 | 365 | 6,289716 | 5,899897 | | 540 | 438 | 6,291569 | 6,082219 | | 682 | 481 | 6,52503 | 6,175867 | | 537 | 396 | 6,285998 | 5,981414 | | 589 | 357 | 6,378426 | 5,877736 | | 626 | 489 | 6,439335 | 6,192362 | | 521 | 409 | 6,25575 | 6,0137115 | | 626 | 468 | 6,43935 | 6,148468 | | 521 | 373 | 6,25575 | 5,921578 | | 658 | 430 | 6,489205 | 6,063785 | | 746 | 543 | 6,614726 | 6,297109 | | |
Исходя из проведённого анализа, любую из представленных моделей можно использовать для дальнейшего анализа, прогнозирования. Однако в линейной модели параметр Фишера существенно отличается от степенной модели, поэтому для расчёта прогнозного значения возьмём линейную модель для исследования. у = 105,82 + 0,54 х. если прогнозное значение денежных доходов составит: тогда прогнозное значение потребительских расходов составит: ур = 105,82 + 0,54 1033,89 = 664,072 тыс. руб. Выполненный прогноз потребительских расходов оказался надёжным (р = 1 - б = 1 - 0,05 = 0,95), и достаточно точным. Задание III Изучается зависимость средней ожидаемой продолжительности жизни от нескольких факторов по данным за 1995 г. |
Страна | У | X1 | X2 | X3 | X4 | | Белоруссия | 70+N | 15,6 | 0,2 | 0,2 | 13+N | | Перу | 66+N | 14,0 | 2,0 | 3,1 | 47+N | | Таиланд | 69+N | 28,0 | 0,9 | 1,3 | 35+N | | Панама | 73+N | 22,2 | 1,7 | 2,4 | 23+N | | Турция | 67+N | 20,7 | 1,7 | 2,1 | 48+N | | Польша | 70+N | 20,0 | 0,3 | 0,6 | 14+N | | Словакия | 72+N | 13,4 | 0,3 | 0,7 | 11+N | | Венесуэла | 71+N | 29,3 | 2,3 | 3,0 | 23+N | | ЮАР | 64+N | 18,6 | 2,2 | 2,4 | 50+N | | Мексика | 72+N | 23,7 | 1,9 | 2,8 | 33+N | | Мавритания | 71+N | 49,0 | 1,3 | 1,8 | 16+N | | Бразилия | 67+N | 20,0 | 1,5 | 1,6 | 44+N | | Тринидад | 72+N | 31,9 | 0,8 | 1,8 | 13+N | | Малайзия | 71+N | 33,4 | 2,4 | 2,7 | 12+N | | Чили | 72+N | 35,3 | 1,5 | 2,1 | 12+N | | Уругвай | 73+N | 24,6 | 0,6 | 1,0 | 18+N | | |
Принятые в таблице обозначения: Y - средняя ожидаемая продолжительность жизни при рождении, лет; X1 - ВВП в паритетах покупательной способности; X2 - темпы прироста населения по сравнению с предыдущим годом, %; X3 - темпы прироста рабочей силы по сравнению с предыдущим годом, %; X4 - коэффициент младенческой смертности, %. 5. Постройте уравнение множественной регрессии в линейной форме с полным набором факторов. Оцените параметры модели. 6. Оцените статистическую значимость уравнения регрессии с помощью критерия Фишера. 7. Постройте матрицу парных коэффициентов корреляции. Установите, какие факторы мультиколлинеарны, удалите зависимые факторы 8. Постройте уравнение регрессии со статистически значимыми факторами. Оцените статистическую значимость нового уравнения регрессии с помощью критерия Фишера. Выполнение задания: Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов (МНК). Получим следующие значения параметров уравнения: |
a | 107,0205 | | b1 | 0, 0076 | | b2 | -2,4341 | | b3 | 2,3801 | | b4 | -0,1494 | | |
Оценим параметры модели с помощью критерия Стьюдента, получим: |
| Стандартная ошибка | t- статистика | Нижняя граница | Верхняя граница | | a | 2,365 | 40,607 | 101,220 | 112,821 | | b1 | 0,053 | 0,144 | -0,109 | 0,124 | | b2 | 1,691 | -1,440 | -6,156 | 1,288 | | b3 | 1,344 | 1,771 | -0,578 | 5,339 | | b4 | 0,038 | -3,952 | -0,233 | -0,066 | | |
Сравнивая фактические значения t-статистики и табличные значения, получаем, что только параметр а был сформирован не случайным образом и статистически значим, значение других параметров меньше табличного значения, следовательно гипотеза Н0 принимается, т.е. b-коэффициенты случайно сформированы, практически мало отличаются от нуля, и статистически не значимы. Аналогичная ситуация с доверительными интервалами для а интервал оправдан, для b интервал проходит через ноль, и следовательно параметры статистически не значимы. Рассчитаем F-критерий: Получим величину Fфакт=8,57. Сравнив данное значение с табличным Fтабл=4,6, т.е. Fфакт > Fтабл, делаем вывод о том, что полученное значение указывает на необходимость отклонить гипотезу Н0 и признать неслучайную природу выявленной зависимости и статистическую значимость параметров уравнения и показателя тесноты связи, а также заключение о статистической значимости уравнения в целом. Несмотря на то, что согласно критерия Фишера модель можно определить как значимую, проверим данные факторы на мультиколлинеарность. |
| x1 | x2 | x3 | x4 | | x1 | 1 | | | | | x2 | 0,193772 | 1 | | | | x3 | 0,217768 | 0,941982 | 1 | | | x4 | -0,38561 | 0,49009 | 0,423844 | 1 | | |
Согласно матрице факторных коэффициентов корреляции получаем, что коллинеарны факторы х2 х3. Однако в нашей модели мы не удалим факторы, так как они связаны друг с другом, а также критерий Фишера является достаточным для включения всех факторов в модель. Задание IV Гипотетическая модель экономики: где С - совокупное потребление в период t; Y - совокупный доход в период t; J - инвестиции в период t; Т - налоги в период t; G - государственные доходы в период t. 1. Применив необходимое и достаточное условие идентификации, определите, идентифицировано ли каждое из уравнений модели. 2. Запишите, если возможно, приведенную форму модели. Выполнение задания: 1. Модель представляет собой систему одновременных уравнений. Для ответа на вопрос о способе оценки параметров модели проверим каждое ее уравнение на идентификацию. Модель включает четыре эндогенные переменные (Ct, Jt, Tt, Yt) и две предопределенные переменные (Gt, Yt-1). Проверим необходимое условие идентификации для устранений модели. 1уравнение. Это уравнение включает три эндогенных переменных, входящих в уравнение: 2+1=3. Уравнение идентифицировано. 2 уравнение. Уравнение 2 включает одну эндогенную переменную (Jt) и одну предопределенную переменную. Получаем, что 1+1>1, уравнение сверхидентифицировано. 3 уравнение. Уравнение 3 включает две эндогенных переменных (Tt, Yt) и нет предопределенных переменных. Получаем, что 2+1>2, уравнение сверхидентифицировано. 4 уравнение. Уравнение 4 есть тождество, параметры которого определять не требуется. Проверим для каждого из уравнений достаточное условие идентификации. Для этого составим матрицу коэффициентов при переменных модели: |
| Ct | Jt | Yt | Yt-1 | Tt | Gt | | 1 уравнение | -1 | b12 | b11 | 0 | 0 | 0 | | 2 уравнение | 0 | -1 | 0 | b21 | 0 | 0 | | 3 уравнение | 0 | 0 | b31 | 0 | -1 | 0 | | 4 уравнение | 1 | 1 | -1 | 0 | 0 | 1 | | |
В соответствии с достаточным условием идентификации определитель матрицы коэффициентов при переменных, не входящих в исследуемое уравнение, не должен быть равен нулю, а ранг матрицы должен быть равен числу эндогенных переменных модели минус 1, т.е. 1 уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид:
Определитель данной матрицы не равен нулю. Достаточное условие идентификации для 1 уравнения выполняется. 2 уравнение. Впишем матрицу коэффициентов при переменных, не входящих в уравнение:
Определитель данной матрицы не равен нулю. Достаточное условие идентификации для 2 уравнения выполняется. 3 уравнение. Выпишем матицу коэффициентов при переменных, не входящих в уравнение:
Определитель данной матрицы не равен нулю. Достаточное условие идентификации для 3 уравнения выполняется. 4 уравнение. Выпишем матрицу коэффициентов при переменных, не входящих в уравнение:
Определитель данной матрицы не равен нулю. Достаточное условие идентификации для 4 уравнения выполняется. Таким образом, для оценки параметров каждого из уравнений будем применять двухшаговый МНК. Согласно данного метода, однозначно нельзя говорить о нахождении всех коэффициентов модели. Запишем приведенную форму модели в общем виде: C1 = A1 + A2Yt-1 + A3G1 + V1 J1 = B1 + B2Yt-1 + B3G1 + V2 T1 = E1 + E2Yt-1 + D4Gt + V3 Y1 = E1 + E2Yt-1 + E3G1 + V4,
|