Экономико-математическое моделирование : Эконометрика
Эконометрика
8 Контрольная работа По эконометрики Обзор корреляционного поля Эти данные скорее всего можно аппроксимировать при помощи линейной регрессии вида y = а - b·x, как самой простой. Рассчитаем необходимые суммы и запишем их в таблице № 1: Таблица №1: |
i | x | y | x? | y? | x·y | y | e | e? | A(%) | | 1 | 2,5 | 69 | 6,25 | 4761 | 172,5 | 66,40 | 2,60 | 6,75 | 3,76 | | 2 | 3 | 65 | 9 | 4225 | 195 | 64,85 | 0,15 | 0,02 | 0,23 | | 3 | 3,4 | 63 | 11,56 | 3969 | 214,2 | 63,61 | -0,61 | 0,37 | 0,97 | | 4 | 4,1 | 59 | 16,81 | 3481 | 241,9 | 61,44 | -2,44 | 5,94 | 4,13 | | 5 | 5 | 57 | 25 | 3249 | 285 | 58,65 | -1,65 | 2,71 | 2,89 | | 6 | 6,3 | 55 | 39,69 | 3025 | 346,5 | 54,61 | 0,39 | 0,15 | 0,70 | | 7 | 7 | 54 | 49 | 2916 | 378 | 52,44 | 1,56 | 2,43 | 2,89 | | Сумма: | 31,3 | 422 | 157,31 | 25626 | 1833,1 | 422,00 | 0,00 | 18,38 | 15,57 | | Среднее: | 4,471 | 60,286 | 22,473 | 3660,857 | 261,871 | - | - | - | 2,22% | | |
Ковариация между y и x рассчитывается по формуле , где , , . Дисперсия и среднее квадратическое отклонение для x и y находим по формулам: = 2,479, = 26,490, 1,575, 5,147. = -7,692 / 2,479 = -3,103; = 60,286 + 3,103 · 4,471 = 74,159 Получили уравнение регрессии: y = 74,159 - 3,103·х (округлено до сотых). Оцениваем качество полученной линейной модели: а) TSS = 25624 - (31,3?) : 7 = 185,492; RSS = TSS - ESS = 185,429 - 18,38 = 176,051, где ESS = = 18,38 (в таблице №1); F - статистика = RSS · (n - m - 1) : ESS = 176,051 · ·5 :18,38 = 45,45. Табличное значение на 1% уровне значимости равно 16,26 (см. таблицу распределения Фишера - Снедекора). Фактическое значение F - статистики больше табличного на 1% уровне значимости, следовательно уравнение регрессии в целом значимо и на 5% уровне значимости. б) Средняя ошибка аппроксимации равна (УА)/7 = ((УIy-yI: y) · 100%) / 7 = 15,57 / 7 = =2,22%, что говорит о хорошей аппроксимации зависимости моделью (2,22% < 6%). Вывод: модель получилась приемлемая (в смысле аппроксимации). в) Коэффициент корреляции находим по формуле: = -0,949: сильная обратная линейная зависимость. г) Коэффициент детерминации находим следующим образом: = 0,901 или вариация x определяет вариацию y на 90,1%. Проверка на соответствие условиям теоремы Гаусса - Маркова а) По таблице №2 рассчитаем статистику Дарбина - Уотсона: Таблица №2 |
i | e? | e | ei-1 | (ei-ei-1)? | =16,050 : 18,38 = 0,8734. | | 1 | 6,75 | 2,60 | - | - | | | 2 | 0,02 | 0,15 | 2,598 | 5,996 | | | 3 | 0,37 | -0,61 | 0,149 | 0,576 | | | 4 | 5,94 | -2,44 | -0,610 | 3,342 | | | 5 | 2,71 | -1,65 | -2,438 | 0,628 | | | 6 | 0,15 | 0,39 | -1,646 | 4,134 | | | 7 | 2,43 | 1,56 | 0,388 | 1,373 | | | Итого: | 18,38 | - | -1,559 | 16,050 | | | |
Полученное значение попадает в область неопределённости: DW (0,7; 1,35). Это значит, что для прояснения вопроса относительно автокорреляции остатков необходимо дальнейшее исследование ряда остатков другими методами, в которых отсутствует зона неопределённости. б) Воспользуемся тестом серий Бройша - Годфри: Таблица №3 |
t | et | et-1 | e?t-1 | et·et-1 | et | (y-bx)? | | 1 | 2,598 | 0,149 | 0,022 | 0,387 | 0,074 | 6,371 | | 2 | 0,149 | -0,610 | 0,372 | -0,091 | -0,302 | 0,204 | | 3 | -0,610 | -2,438 | 5,944 | 1,487 | -1,208 | 0,358 | | 4 | -2,438 | -1,646 | 2,709 | 4,013 | -0,816 | 2,632 | | 5 | -1,646 | 0,388 | 0,151 | -0,639 | 0,192 | 3,379 | | 6 | 0,388 | 1,559 | 2,430 | 0,605 | 0,773 | 0,148 | | Итого: | -1,559 | -2,598 | 11,628 | 5,763 | -1,287 | 13,092 | | |
На основании полученных данных построим уравнение регрессии без свободного члена вида y=b·x. При этом стандартная ошибка коэффициента регрессии b, рассчитанная по формуле: , , = 1,181, что меньше значения t табл. =2,57. Это означает, что автокорреляция первого уровня отсутствует. Однако следует отметить, что и тест Дарбина - Уотсона и тест серий Бройша - Годфри применяются только для выборок достаточно большого размера Кристофер Доугерти. Введение в эконометрику. М.: Инфра М, 2001. С. 238., в то время как предложенная нам для анализа выборка состоит только лишь из семи значений. в) При помощи критерия серий проверим случайность распределения уровней ряда остатков. С 95% вероятностью распределение ряда остатков считается случайным, если одновременно выполняются два неравенства: 1) общее число серий должно быть больше двух, и 2) - максимальная длина серии должна быть строго меньше пяти. Данные для расчётов получаем из таблицы № 4. Таблица № 4. Критерий серий линейная модель не проходит: |
ei | ei - ei-1 | серии | Число серий = 2, Продолжительность самой длинной серии равна 3. 2 = = [2.079] = 2. (не выполняется), хотя 3 < 5. Значит уровни распределены не случайно. | | 0,149 | -2,449 | + | | | -0,610 | -0,759 | + | | | -2,438 | -1,828 | + | | | -1,646 | 0,792 | - | | | 0,388 | 2,033 | - | | | 1,559 | 1,172 | - | | | |
г) Соответствие ряда остатков нормальному закону распределения проверяем, используем RS-критерий: = 2,63, где . Значение нашего RS-критерия для 7 наблюдений практически попадает в интервал [2,67 3,69], (для 10 наблюдений) хотя и этот критерий определён для выборок более 10 единиц. д) При помощи теста ранговой корреляции Спирмена определяем отсутствие или наличие гетероскедастичности. Таблица № 5. |
Ранг Х | Х | I ei I | Ранг еi | Di | D?i | Коэффициент ранговой кореляции определяется по формуле: | | 1 | 2,5 | 2,60 | 7 | -6 | 36 | | | 2 | 3 | 0,15 | 4 | -2 | 4 | | | 3 | 3,4 | 0,61 | 3 | 0 | 0 | | | 4 | 4,1 | 2,44 | 1 | 3 | 9 | | | 5 | 5 | 1,65 | 2 | 3 | 9 | | | 6 | 6,3 | 0,39 | 5 | 1 | 1 | | | 7 | 7 | 1,56 | 6 | 1 | 1 | | | |
Так как абсолютное значение статистики коэффициента ранговой корелляции =0,175 оказалась значительно меньше табличного значения , то гетероскедастичность отсутствует. Вывод: линейная модель не соответствует всем предпосылкам регрессионного анализа (условиям теоремы Гаусса-Маркова) и, хотя она пригодна для прогнозирования, но возникает вопрос о её значимости. Доверительные интервалы для параметра b регрессии Стандартные ошибки для параметров регрессии находим по формулам: = 0,46, = 2,18. Проверим на статистическую значимость коэффициент b модели, для чего рассчитаем t-статистику по формуле . Полученная t-статистика равна -6,742, что по модулю больше табличного значения t = 2,57. Экономически этот параметр интерпретируется так: при изменении дохода потребителей на одну единицу объёмы продаж изменятся на -3,103 ед. Проверим на статистическую значимость коэффициент a модели, для чего рассчитаем t-статистику по формуле . Полученная t-статистика равна 33,992, что больше табличного значения t = 2,57. Доверительный интервал параметра b определяем по формуле: ; s = = 1,917, Доверительный интервал параметра b составляет ; или ( tтабл. = 2.57, Д = 2,57 · 0,4602 = 1,1827). Проведённый анализ коэффициентов регрессии говорит о том, что параметры регрессии значимы, кроме того и уравнение регрессии в целом значимо на 1% уровне значимости (cм. выше). Это позволяет использовать построенную нами модель для получения прогнозов. Точечный и интервальный прогнозы Вначале находим точечный прогноз для значения х, на 25% превышающего среднее значение = 4,47 ( т.е. при = 5,589), . Тогда стандартная ошибка прогноза составит: , tтабл. = 2.57, Д = 2,57 · 2,18 = 5,604. Интервальный прогноз для точечного прогноза при = 5,589 () составит: или .
|