УЗНАЙ ЦЕНУ

(pdf, doc, docx, rtf, zip, rar, bmp, jpeg) не более 4-х файлов (макс. размер 15 Мб)


↑ вверх
Тема/ВариантКурсовая по эконометрике
ПредметСтатистика
Тип работыкурсовая работа
Объем работы26
Дата поступления12.12.2012
700 ₽
СодержаниеЗадача 1.rnПо территории Южного федерального округа приводятся статистические данные за 2000 год:rnТерритория федерального округа Валовой региональный продукт, млрд. руб., Y Среднегодовая численность занятых в экономике, млн. чел., Xrn1. Респ. Адыгея 5,1 0,157rn2. Респ. Дагестан 13,0 0,758rn3. Респ. Ингушетия 2,0 0,056rn4. Кабардино – Балкарская Респ. 10,5 0,287rn5. Респ. Калмыкия 2,1 0,119rn6. Карачаево- Черкесская Респ. 4,3 0,138rn7. Респ. Северная Осетия – Алания 7,6 0,220rn8. Краснодарский край 109,1 2,033rn9. Ставропольский край 43,4 1,008rn10. Астраханская обл. 18,9 0,422rn11. Волгоградская обл. 50,0 1,147rn12. Ростовская обл. 69,0 1,812rnИтого 335 8,157rnСредняя 27,917 0,6798rnСреднее квадратическое отклонение 32,20 0,6550rnДисперсия 1036,87 0,4290rnrnЗадание:rn1. Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X.rn2. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.rn3. Рассчитайте параметры a1 и a0 парной линейной функции и линейно-логарифмической функции .rn4. Оцените тесноту связи с помощью показателей корреляции (r и ρ) и детерминации (r2 и ρ2), проанализируйте их значения.rn5. Надёжность уравнений в целом оцените через F-критерий Фишера для уровня значимости =0,05.rn6. На основе оценочных характеристик выберите лучшее уравнение регрессии и поясните свой выбор.rn7. По лучшему уравнению регрессии рассчитайте теоретические значения результата ( ), по ним постройте теоретическую линию регрессии и определите скорректированную среднюю ошибку аппроксимации - ε\\\'ср., оцените её величину.rn8. Рассчитайте прогнозное значение результата , если прогнозное значение фактора ( ) составит 1,023 от среднего уровня ( ).rn9. Рассчитайте интегральную и предельную ошибки прогноза (для =0,05), определите доверительный интервал прогноза ( ; ), а также диапазон верхней и нижней границ доверительного интервала ( ), оценивая точность выполненного прогноза.rnРешение:rnПредварительный анализ исходных данных выявил наличие одной территории (Краснодарский край) с аномальными значениями признаков. Эта территория исключена из дальнейшего анализа. rnРасположим территории по возрастанию фактора X. rnТерритория федерального округа Среднегодовая численность занятых в экономике, млн. чел., X факт. Валовой региональный продукт, млрд. руб., Y rn3. Респ. Ингушетия 0,056 2rn5. Респ. Калмыкия 0,119 2,1rn6. Карачаево- Черкесская Респ. 0,138 4,3rn1. Респ. Адыгея 0,157 5,1rn7. Респ. Северная Осетия – Алания 0,22 7,6rn4. Кабардино – Балкарская Респ. 0,287 10,5rn10. Астраханская обл. 0,422 18,9rn2. Респ. Дагестан 0,758 13rn9. Ставропольский край 1,008 43,4rn11. Волгоградская обл. 1,147 50rn12. Ростовская обл. 1,812 69rnИтого 6,124 225,900rnСредняя 0,557 20,536rnСреднее квадратическое отклонение 0,535 21,852rnДисперсия 0,286 477,502rnОбычно моделирование начинается в построения уравнения прямой: , отражающей линейную форму зависимости результата Y от фактора X. rnРасчёт неизвестных параметров уравнения выполним методом наименьших квадратов (МНК), построив систему нормальных уравнений и решая её, относительно неизвестных а0 и а1. Для расчёта используем значения определителей второго порядка Δ, Δа0 и Δа1. Расчётные процедуры представим в разработочной таблице, в которую, кроме значений Y и X, войдут X2, X*Y, а также их итоговые значения, средние, сигмы и дисперсии для Y и X. rnРасчётная таблица.rn№ rn rn rn rn rn rn rn rnrnА 1 2 3 4 5 6 7 8rn1 0,056 2 0,003 0,112 0,725 1,275 1,626 6,209rn2 0,119 2,1 0,014 0,250 3,218 -1,118 1,249 5,442rn3 0,138 4,3 0,019 0,593 3,969 0,331 0,109 1,610rn4 0,157 5,1 0,025 0,801 4,721 0,379 0,144 1,845rn5 0,22 7,6 0,048 1,672 7,214 0,386 0,149 1,881rn6 0,287 10,5 0,082 3,014 9,865 0,635 0,404 3,094rn7 0,422 18,9 0,178 7,976 15,206 3,694 13,647 17,988rn8 0,758 13 0,575 9,854 28,500 -15,500 240,243 75,475rn9 1,008 43,4 1,016 43,747 38,391 5,009 25,089 24,390rn10 1,147 50 1,316 57,350 43,891 6,109 37,324 29,749rn11 1,812 69 3,283 125,028 70,202 -1,202 1,444 5,851rnИтого 6,124 225,900 6,559 250,397 225,900 0,000 321,427 173,536rnСредняя 0,557 20,536 — — — — — 15,776rnСигма 0,535 21,852 — — — — — —rnДисперсия, D 0,286 477,502 — — — — — —rnΔ= 34,650 — — — — — — —rnΔа0= -51,654 rn-1,491 — — — — —rnΔа1= 1370,950 rn39,565 — — — — —rnrnРасчёт определителя системы выполним по формуле:rn 11*6,559 –6,124*6,124 = 34,650;rn Расчёт определителя свободного члена уравнения выполним по формуле:rn 225,900*6,559 – 250,397*6,124 = -51,654.rn Расчёт определителя коэффициента регрессии выполним по формуле:rn 11*250,397 – 225,900*6,124 = 1370,950.rnРасчёт параметров уравнения регрессии даёт следующие результаты:rn ; .rnВ конечном счёте, получаем теоретическое уравнение регрессии следующего вида:rn rnВ уравнении коэффициент регрессии а1 = 39,565 означает, что при увеличении среднегодовой численности занятых в экономике на 1 млн. чел. (от своей средней) валовой региональный продукт возрастёт на 39,565 млрд. руб. (от своей средней).rnСвободный член уравнения а0 = -1,491 оценивает влияние прочих факторов, оказывающих воздействие на валовой региональный продукт.rnОтносительную оценку силы связи даёт общий (средний) коэффициент эластичности: rn rnВ нашем случае, когда рассматривается линейная зависимость, расчётная формула преобразуется к виду:rn rnЭто означает, что при изменении среднегодовой численности занятых в экономике на 1% от своей средней валовой региональный продукт увеличивается на 1,073 процента от своей средней.rnДля оценки тесноты связи рассчитаем линейный коэффициент парной корреляции:rn rnКоэффициент корреляции, равный 0,9687, показывает, что выявлена весьма тесная зависимость между среднегодовой численностью занятых в экономике и валовым региональным продуктом. Коэффициент детерминации, равный 0,9384, устанавливает, что вариация валового регионального продукта на 93,84% из 100% предопределена вариацией среднегодовой численности занятых в экономике; роль прочих факторов, влияющих на розничный товарооборот, определяется в 6,16%, что является сравнительно небольшой величиной.rnДля оценки статистической надёжности выявленной зависимости дохода от доли занятых рассчитаем фактическое значение F-критерия Фишера – Fфактич. и сравним его с табличным значением – Fтабл. По результатам сравнения примем решения по нулевой гипотезе , то есть, либо примем, либо отклоним её с вероятностью допустить ошибку, которая не превысит 5% (или с уровнем значимости α=0,05).rnВ нашем случае, ; где -число факторов в уравнении; - число изучаемых объектов. Фактическое значение критерия показывает, что факторная вариация результата в 137 раза больше остаточной вариации, сформировавшейся под влиянием случайных причин. Очевидно, что подобные различия не могут быть случайными, а являются результатом систематического взаимодействия оборота розничной торговли и общей суммы доходов населения. Для обоснованного вывода сравним полученный результат с табличным значением критерия: при степенях свободы d.f.1=k=1 и d.f.2=n-k-1=11-1-1=9 и уровне значимости α=0,05. rnВ силу того, что , нулевую гипотезу о статистической незначимости выявленной зависимости валового регионального продукта от среднегодовой численности занятых в экономике и её параметрах можно отклонить с фактической вероятностью допустить ошибку значительно меньшей, чем традиционные 5%.rnПостроим теоретическую линю регрессии, которая пересечётся с эмпирической регрессией в нескольких точках. rnrnГрафик 1rn rnОценку качества модели дадим с помощью скорректированной средней ошибки аппроксимации:rn .rn В нашем случае, скорректированная ошибка аппроксимации составляет 15,776%. Она указывает на невысокое качество построенной линейной модели и ограничивает её использование для выполнения точных прогнозных расчётов даже при условии сравнительно небольшого изменения фактора X (относительно его среднего значения ).rnПостроение логарифмической функции предполагает предварительное выполнение процедуры линеаризации исходных переменных. В данном случае, для преобразования нелинейной функции в линейную введём новую переменную , которая линейно связана с результатом. Следовательно, для определения параметров модели будут использованы традиционные расчётные приёмы, основанные на значениях определителей второго порядка. rnРасчётная таблица.rn№ rn rn rn rn rn rn rn rn rnrnА 1 2 3 4 5 6 7 8 9rn1 0,056 -2,882 2,000 8,308 -5,765 -12,249 14,249 203,023 69,382rn2 0,119 -2,129 2,100 4,531 -4,470 1,550 0,550 0,303 2,680rn3 0,138 -1,981 4,300 3,922 -8,516 4,261 0,039 0,001 0,188rn4 0,157 -1,852 5,100 3,428 -9,443 6,623 -1,523 2,318 7,414rn5 0,220 -1,514 7,600 2,293 -11,507 12,799 -5,199 27,025 25,314rn6 0,287 -1,248 10,500 1,558 -13,107 17,665 -7,165 51,341 34,890rn7 0,422 -0,863 18,900 0,744 -16,306 24,722 -5,822 33,901 28,352rn8 0,758 -0,277 13,000 0,077 -3,602 35,444 -22,444 503,720 109,288rn9 1,008 0,008 43,400 0,000 0,346 40,662 2,738 7,499 13,335rn10 1,147 0,137 50,000 0,019 6,857 43,026 6,974 48,632 33,958rn11 1,812 0,594 69,000 0,353 41,016 51,397 17,603 309,860 85,715rnИтого 6,124 -12,006 225,900 25,234 -24,497 225,900 0,000 1187,624 410,517rnСредняя 0,557 -1,091 20,536 — — — — 107,966 37,32rnСигма 0,535 1,050 21,852 rnДисперсия, D 0,286 1,103 477,502 rnrnРасчёт определителей второго порядка даёт следующие результаты:rn ; ; . Отсюда получаем параметры уравнения:rn , rnПолученное уравнение имеет вид: . rnОценочные показатели позволяют сделать вывод, что линейно-логарифмическая функция описывает изучаемую связь хуже, чем линейная модель: оценка тесноты выявленной связи ρ=0,8798 (сравните с 0,7741), скорректированная средняя ошибка аппроксимации здесь выше и составляет 37,32%, то есть возможности использования для прогноза данной модели более ограничены.rnЗаключительным этапом решения данной задачи является выполнение прогноза и его оценка.rnЕсли прогнозное значение фактора ( ) составит 1,023 от среднего уровня ( ), то есть Xпрогнозн.= 1,023*0,557=0,569, тогда прогнозное значение результата сформируется на уровне: Yпрогнозн. =39,565-1,491*0,569=38,715 (млрд. руб.). rnРассчитаем интегральную ошибку прогноза - , которая формируется как сумма двух ошибок: из ошибки прогноза как результата отклонения прогноза от уравнения регрессии- и ошибки прогноза положения регрессии - . То есть, .rnВ нашем случае , где k- число факторов в уравнении, которое в данной задаче равно 1. Тогда (млрд. руб.).rnОшибка положения регрессии составит: =rn= = 0,012 (млрд. руб.).rnИнтегральная ошибка прогноза составит: = = 5,976 (млрд. руб.).rnПредельная ошибка прогноза, которая не будет превышена в 95% возможных реализаций прогноза, составит: = 2,26*5,976 = 13,506 ≈ 14,0 (млрд. руб.). Табличное значение t-критерия для уровня значимости α=0,05 и для степеней свободы n-k-1 = 11-1-1=7 составит 2,26. Следовательно, ошибка большинства реализаций прогноза не превысит млрд. руб.rnЭто означает, что фактическая реализация прогноза будет находиться в доверительном интервале . Верхняя граница доверительного интервала составит rn = 38,715 + 14,0 = 52,715(млрд. руб.). rnНижняя граница доверительного интервала составит: = 38,715 - 14,0 = 24,715(млрд. руб.).rnОтносительная величина различий значений верхней и нижней границ составит: = раза. Это означает, что верхняя граница в 2,13 раза больше нижней границы, то есть точность выполненного прогноза весьма невелика, но его надёжность на уровне 95% оценивается как высокая. Причиной небольшой точности прогноза является повышенная ошибка аппроксимации. Здесь её значение выходит за границу 5-7% из-за недостаточно высокой типичности линейной регрессии, которая проявляется в присутствии единиц с высокой индивидуальной ошибкой. Если удалить территории с предельно высокой ошибкой (например, Дагестан с ), тогда качество линейной модели и точность прогноза по ней заметно повысятся.rn rnЗадача № 2.rnПроизводится анализ значений социально – экономических показателей по территориям Северо - Западного федерального округа РФ за 2000 год.rn – Оборот розничной торговли, млрд. руб.; rn – кредиты, предоставленные в 2000 году предприятиям, организациям, банкам и физическим лицам, млрд. руб.;rn – доля лиц с высшим и незаконченным образованием среди занятых, %;rn – годовой доход всего населения, млрд. руб.rnТребуется изучить влияние указанных факторов на стоимость валового регионального продукта.rnПредварительный анализ исходных данных по 10 территориям выявил наличие двух территорию (г.Санкт-Петербург и Вологодская обл.) с аномальными значениями признаков. Эти территории должны быть исключены из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанных аномальных единиц.rnПри обработке исходных данных получены следующие значения:rn а) - линейных коэффициентов парной корреляции, средних и средних квадратических отклонений -σ:rnN=8.rn rn rn rn rnrn rn1 0,2461 0,0117 0,9313rn rn0,2461 1 0,8897 0,0123rn rn0,0117 0,8897 1 -0,2041rn rn0,9313 0,0123 -0,2041 1rnСредняя 13,64 0,2134 22,29 24,69rn rn4,250 0,1596 2,520 9,628rnrn б) - коэффициентов частной корреляцииrn rn rn rn rnrn rn1 0,3734 -0,0388 0,9473rn rn0,3734 1 0,8483 -0,2322rn rn-0,0388 0,8483 1 -0,1070rn rn0,9473 -0,2322 -0,1070 1rnЗадание:rn1. По значениям линейных коэффициентов парной и частной корреляции выберите неколлинеарные факторы и рассчитайте для них коэффициенты частной корреляции. Произведите окончательный отбор информативных факторов во множественную регрессионную модель.rn2. Выполните расчёт бета коэффициентов () и постройте с их помощью уравнение множественной регрессии в стандартизованном масштабе. Проанализируйте с помощью бета коэффициентов () силу связи каждого фактора с результатом и выявите сильно и слабо влияющие факторы.rn3. По значениям -коэффициентов рассчитайте параметры уравнения в естественной форме (то есть a1, a2, и a0). Проанализируйте их значения. Сравнительную оценку силы связи факторов дайте с помощью общих (средних) коэффициентов эластичности - .rn4. Оцените тесноту множественной связи с помощью R и R2, а статистическую значимость уравнения и тесноту выявленной связи - через F-критерий Фишера (для уровня значимости =0,05).rn5. Рассчитайте прогнозное значение результата , предполагая, что прогнозные значения факторов ( )составят 108,5 процента от их среднего уровня.rn6. Основные выводы оформите аналитической запиской.rnrnРешение:rn1. Представленные в условии задачи значения линейных коэффициентов парной корреляции позволяют установить, что оборот розничной торговли -Y более тесно связан с годовым доходом всего населения - ( ) и с - долей лиц с высшим и незаконченным образованием среди занятых ( ); наименее тесно результат Y связан с - кредитами, предоставленными в 2000 году предприятиям, организациям, банкам и физическим лицам. Поэтому, в силу небольшой информативности фактора ,, предполагаем, что его можно исключить из дальнейшего анализа. Проверим наши предположения с помощью анализа матрицы коэффициентов частной корреляции. Очевидно, что наиболее тесная связь результата Y с годовым доходом всего населения - ( ) и с - о среднегодовой численностью населения ( ) и наименее тесно результат Y связан с - кредитами, предоставленными в 2000 году предприятиям, организациям, банкам и физическим лицам. ( ). Поэтому для уточнения окончательного вывода выполним расчёт серии коэффициентов частной корреляции Y с двумя возможными комбинациями факторных признаков: для Y с и с , а также для Y c и .rnРасчёты частных коэффициентов корреляции выполним по следующим формулам:rn rn rnrn rnrnКак видим, факторы и , действительно, тесно связаны с результатом, и между собой сильно взаимодействуют.rnРасчёт аналогичных показателей по следующей паре факторов приводит к иным результатам:rnrn rnrn rnrn rnrnВ данном случае, межфакторное взаимодействие оценивается как заметное ( ), а фактор слабо связан с результатом. Таким образом, первая из рассмотренных пар факторных признаков (X1 и X3 ) в большей мере отвечает требованиям, предъявляемым МНК к исходным данным и, в частности, к отсутствию межфакторного взаимодействия. Указанные обстоятельства позволяют использовать X1 и X3 в качестве информативных факторов уравнения множественной регрессии.rn2. При построении двухфакторной регрессионной модели воспользуемся для упрощения расчётов методом стандартизованных переменных. В этом случае, исходное уравнение приобретает вид: . Выполним расчёт - коэффициентов, используя значения известных по условию линейных коэффициентов парной корреляции.rn ;rn ;rnВ результате получено уравнение в стандартизованном масштабе:rnrn rnПараметры данного уравнения представляют собой относительные оценки силы влияния каждого из факторов на результат. При увеличении первого фактора на одну сигму - (от своей средней) оборот розничной торговли увеличивается на 0,235 своей сигмы ( ); с увеличением второго фактора на результат увеличивается на 0,928 . В данном случае, увеличение розничного товарооборота происходит, прежде всего, под влиянием третьего фактора и в меньшей степени – в результате увеличения первого фактора.rn3. Используя значения - коэффициентов, можно рассчитать параметров уравнения в естественной форме: rn rn .rnВ конечном счёте, имеем уравнение: . По значениям коэффициентов регрессии можно судить о том, на какую абсолютную величину изменяется результат при изменении каждого фактора на единицу (от своей средней).rnС увеличением первого фактора на 1 единицу результат увеличивается на 6,258 млрд. руб., с увеличением третьего фактора на 1 единицу увеличивается на 0,409 млрд. руб. rnНо так как признаки-факторы измеряются в разных единицах, сравнивать значения их коэффициентов регрессии не следует. Точную оценку силы связи факторов с результатом дают коэффициенты эластичности и β - коэффициенты.rn4. Для сравнительной оценки силы связи выполним расчёт средних коэффициентов эластичности. С их помощью можно определить, на сколько процентов изменяется результат при изменении фактора на 1% (от своего среднего значения). В нашем случае, расчёт показал, что первого фактора на розничный товарооборот оказалось менее сильным по сравнению с влиянием третьего фактора: с ростомпервого фактора на 1% розничный товарооборот увеличивается на 0,098%, а при увеличении третьего фактора на 1% розничный товарооборот уменьшается на 0,74%. Различия в силе влияния весьма значительны: первый фактор влияет на результат в семь с лишним раз слабее, чем третий. Поэтому регулирование величины розничного товарооборота через третий фактор будет более результативным, чем через первый.rn ; .rn6. Тесноту выявленной зависимости розничного товарооборота от инвестиций в экономику региона и от численности населения оценивают множественный коэффициент корреляции и детерминации. Расчёт коэффициента корреляции выполним, используя известные значения линейных коэффициентов парной корреляции и β – коэффициентов: В нашем случае 2-х факторной зависимости расчёт строится следующим образом:rn .rn rnКак показали расчёты, установлена весьма тесная зависимость розничного товарооборота от первого и третьего фактора. Это означает, что 92,2% вариации розничного товарооборота определены вариацией данных факторов. Оставшиеся 7,8% вариации результата сформировались под влиянием прочих причин, роль которых незначительна.rn7. Оценка статистической значимости или надёжности установленной формы зависимости, её параметров, оценок её силы и тесноты является важным этапом анализа результатов. Для выполнения оценки формулируется нулевая гипотеза, которая рассматривает предположение о случайной природе полученных результатов. То есть, .rnДля проверки выдвинутой нулевой гипотезы используется F-критерия Фишера. Его фактическое значение определяется, исходя из соотношения факторной и остаточной дисперсий и их степеней свободы: d.f.1=k и d.f.2=n-k-1; где: n –число изучаемых единиц; k – число ограничений, которые накладываются на исходные данные при расчёте данного показателя. Здесь k равно числу факторов уравнения, то есть k=2.rn .rnВ нашем случае, когда рассматривается зависимость результата от двух факторов, расчёт выглядит следующим образом:rn .rnФактическое значение критерия показывает, что детерминация, сформированная под воздействием двух изучаемых факторов, почти в 30 раз больше, чем детерминация, связанная с действием прочих причин. Очевидно, что подобное соотношение случайно сформироваться не может, а является результатом влияния существенных, систематических факторов. rnДля принятия обоснованного решения Fфактич. сравнивается с Fтабличн., которое формируется случайно и зависит степеней свободы факторной (d.f.1 = k) и остаточной (d.f.2 = n-k-1) дисперсий, а также от уровня значимости α=0,05. В нашем примере, где d.f.1=k= 2 и d.f.2=n-k-1 = 8-2-1=5 при α=0,05 Fтабл = 5,79. В силу того, что Fфактич =29,551> Fтабл. = 5,79, можно с высокой степенью надёжности отклонить нулевую гипотезу, а в качестве альтернативы – согласиться с утверждением, что проверяемые параметры множественной регрессионной модели неслучайны, что коэффициенты уравнения и показатели тесноты связи не являются случайными величинами.rn8. Техническая часть прогнозных расчётов по уравнению множественной регрессии сравнительно проста. Достаточно определить прогнозные значения каждого факторного признака , подставить их в уравнение и выполнить с ними расчёт прогнозного значения результата - . При этом следует помнить, что требования к точности и надёжности прогноза предъявляют к используемой модели повышенные требования. В нашем случае, прогнозное значение каждого из факторов, то есть и , получено на основе средней величины:rn . .rnПосле подстановки в уравнение получаем следующий результат:rn (млрд. руб.)rnЕсли кредиты, предоставленные в 2000 году предприятиям, организациям, банкам и физическим лицам возрастут до 0,232 млрд. руб., а годовой доход всего населения составит 26,789 млрд. руб., тогда следует ожидать, что розничный товарооборот возрастёт до 14,615 млрд. руб., то есть увеличится на 7,2% от своего среднего уровня. rn rnЗадача 3.rnДля проверки рабочих гипотез (№1 и №2) о связи социально-экономических показателей в регионе используется статистическая информация за 2000 год по территориям Центрального федерального округа.rn –среднегодовая стоимость основных фондов в экономике, млрд. руб.;rnY2 – стоимость валового регионального продукта, млрд. руб.;rn – Инвестиции прошлого, 1999, года в основной капитал, млрд. руб.;rn – кредиты прошлого, 1999, года, предоставленные предприятиям, организациям, банкам и физическим лицам, млрд. руб.;rn -.среднегодовая численность занятых в экономике, млн. чел.rnРабочие гипотезы:rn rnПредварительный анализ исходных данных по 18 территориям выявил наличие трёх территорий (г. Москва, Московская обл., Воронежская обл.) с аномальными значениями признаков. Эти единицы должны быть исключены из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанных аномальных единиц.rnПри обработке исходных данных получены следующие значения линейных коэффициентов парной корреляции, средних и средних квадратических отклонений -σ:rnN=15.rn Для проверки рабочей гипотезы №1. Для проверки рабочей гипотезы №2.rn Y1 rn rn Y2 rn rnrnY1 1 0,6631 0,7477 Y2 1 0,7863 0,7337rn rn0,6631 1 0,4747 rn0,7863 1 0,6177rn rn0,7477 0,4747 1 rn0,7337 0,6177 1rnСредняя 115,83 0,1615 3,75 Средняя 23,77 115,83 0,570rn rn30,0303 0,1400 1,6836 rn7.2743 30,0303 0,1160rnЗадание: rn1. Составьте систему уравнений в соответствии с выдвинутыми рабочими гипотезами.rn2. Определите вид уравнений и системы.rn3. На основе приведённых в условии значений матриц коэффициентов парной корреляции, средних и средних квадратических отклонений:rn- определите бета коэффициенты () и постройте уравнения множественной регрессии в стандартизованном масштабе;rn- дайте сравнительную оценку силы влияния факторов на результат;rn- рассчитайте параметры a1, a2 и a0 уравнений множественной регрессии в естественной форме;rn- с помощью коэффициентов парной корреляции и  - коэффициентов рассчитайте для каждого уравнения линейный коэффициент множественной корреляции (R) и детерминации (R2);rn- оцените с помощью F-критерия Фишера статистическую надёжность выявленных связей.rn4. Выводы оформите краткой аналитической запиской.rnРешение:rn1.В соответствии с выдвинутыми рабочими гипотезами о связи признаков составим систему уравнений. Коэффициенты при эндогенных переменных обозначим через b , коэффициенты при экзогенных переменных - через a. Каждый коэффициент имеет двойную индексацию: первый индекс – номер уравнения, второй – индивидуальный номер признака. Тогда:rn rn2. Особенность данной системы в том, что в первом уравнении факторы представлены перечнем традиционных экзогенных переменных, значения которых формируются вне данной системы уравнений. Во втором уравнении в состав факторов входит эндогенная переменная Y1, значения которой формируются в условиях данной системы, а именно, в предыдущем уравнении. Системы уравнений, в которых переменные первоначально формируются как результаты, а в дальнейшем выступают в качестве факторов, называются рекурсивными. Именно с подобной системой уравнений имеем дело в данной задаче.rn3. Выполним расчёт -коэффициентов и построим уравнения множественной регрессии в стандартизованном масштабе. Для уравнения №1:rn rnrnПо полученным результатам построено уравнение в стандартизованном виде:rn rnПо данным первого уравнения сделаем вывод, что фактор влияет на результат - среднегодовую стоимость основных фондов в экономике слабее, чем второй фактор , т.к. .rnВторое уравнение можно построить на основе следующих результатов:rn rnВторое уравнение в стандартизованной форме имеет вид: .rnИз второго уравнения очевидно, что на Y2 – стоимость валового регионального продукта среднегодовая стоимость основных фондов в экономике оказывает более сильное влияние, чем третий фактор. rn4. Расчёт параметров уравнения регрессии в естественной форме даёт следующие результаты: rn rn = 115,83 – 85,329*0,1615 – 9,969*3,75 = 64,665.rn5.rnПо полученным результатам построено уравнение №1 в естественной форме:rn .rnПараметры уравнения №2 рассчитываются аналогичным образом. Но главная отличительная особенность их расчёта в том, что в качестве одного из факторов выступают не фактические значения , а его теоретические значения , полученные расчётным путём при подстановке в уравнение №1 фактических значений факторов и .rnУказанным способом рассчитаны параметры рекурсивного уравнения:rnrn rn ;rn .rnПо полученным результатам построено уравнение №2 в естественной форме:rn .rnПредставим результаты построения уравнений в виде рекурсивной системы:rn rnЗначения коэффициентов регрессии каждого из уравнений могут быть использованы для анализа силы влияния каждого из факторов на результат. Но для сравнительной оценки силы влияния факторов необходимо использовать либо значения - коэффициентов, либо средних коэффициентов эластичности - , , и .rn5. Для каждого из уравнений системы рассчитаем показатели корреляции и детерминации.rn .rn .rnВ первом уравнении факторы и объясняют 82,56% вариации среднегодовой стоимости основных фондов в экономике, а 17,44% его вариации определяется влиянием прочих факторов.rnВо втором уравнении переменные и объясняют 84,72% стоимости валового регионального продукта, а 15,28% изменений зависят от прочих факторов. Обе регрессионные модели выявляют тесную связь результата с переменными факторного комплекса.rn6.Оценим существенность выявленных зависимостей. Для этого сформулируем нулевые гипотезы о статистической незначимости построенных моделей и выявленных ими зависимостей:rn и .rnДля проверки нулевых гипотез используется F-критерий Фишера. Выполняется расчёт его фактических значений, которые сравниваются с табличными значениями критерия. По результата сравнения принимается решение относительно нулевой гипотезы.rnВ нашей задаче:rn ; rnТабличные значения F-критерия формируются под влиянием случайных причин и зависят от трёх условий: а) от числа степеней свободы факторной дисперсии - , где k – число факторных переменных в модели; б) от числа степеней свободы остаточной дисперсии - , где n – число изучаемых объектов; в) от уровня значимости , который определяет вероятность допустить ошибку, принимая решение по нулевой гипотезе. Как правило, значение берут на уровне 5% ( =0,05), но при высоких требованиях к точности принимаемых решений уровень значимости составляет 1% ( =0,01) или 0,1% (( =0,001).rnВ рассматриваемой задаче для и =0,05 составляет 3,88. В силу того, что нулевую гипотезу о статистической незначимости характеристик уравнения №1 следует отклонить, то есть . Аналогичное решение принимается и относительно второй нулевой гипотезы, т.к. . То есть, .Отклоняя нулевую гипотезу, допустимо (с определённой степенью условности) принять одну из альтернативных гипотез. В частности, может быть рассмотрена и принята гипотеза о том, что параметры моделей неслучайны, то есть формируются под воздействием представленных в моделях факторов, влияние которых на результат носит систематический, устойчивый характер. Это означает, что полученные результаты могут быть использованы в аналитической работе и в прогнозных расчётах, которые основаны не только на влиянии , но и на влиянии эндогенной переменной Рекурсивные модели связей предоставляют возможность подобного анализа и прогноза.rn rnЗадача 4.rnПредлагается изучить взаимосвязи социально-экономических характеристик региона за период.rn удельный вес занятых в экономике среди всего населения региона, %;rn среднемесячная заработная плата 1-го занятого в народном хозяйстве региона, тыс. руб.;rn среднемесячный душевой доход населения региона, тыс. руб.;rn средний возраст населения региона, лет;rn доля безработных экономически активного населения, %;rn стоимость продукции и услуг в среднем на 1-го занятого в народном хозяйстве региона, тыс. руб.rn инвестиции текущего года в народное хозяйство региона, млрд. руб.rn среднемесячный размер назначенной пенсии, тыс. руб.rnПриводится система рабочих гипотез, которые необходимо проверить. rnrn rnЗаданиеrn1.Используя рабочие гипотезы, постройте систему уравнений, определите их вид и проведите их идентификацию;rn2.Укажите, при каких условиях может быть найдено решение каждого из уравнений и системы в целом. Дайте обоснование возможных вариантов подобных решений и аргументируйте выбор оптимального варианта рабочих гипотез;rn3.Опишите методы, с помощью которых будет найдено решение уравнений (косвенный МНК, двухшаговый МНК).rnРешение.rn1. В соответствии с предложенными рабочими гипотезами построим график, отображающий связи каждой из представленных переменных с другими переменными. Отличительной особенностью уравнений системы является наличие прямых и обратных зависимостей между переменными Y1, Y2 и Y3. Указанная особенность характерна для так называемых структурных уравнений. В состав структурных уравнений входят: а) эндогенные переменные (Yj), значения которых формируется в условиях данной системы признаков и их взаимозависимостей и б) экзогенные переменные (xm), значения которых формируются вне данной системы признаков и условий, но сами экзогенные переменные участвуют во взаимосвязях данной системы и оказывают влияние на эндогенные переменные. Коэффициенты при эндогенных переменных обозначаются через , коэффициенты при экзогенных переменных обозначаются через , где i-число изучаемых объектов; m –число экзогенных переменных, которые обычно обозначают через x; j - число эндогенных переменных, обычно обозначаемых через Y. Таким образом, в каждом уравнении системы каждый коэффициент при переменной имеет двойную индексацию: 1) - номер эндогенной переменной, расположенной в левой части уравнения и выступающей в качестве результата; 2) – номер переменной, находящейся в правой части уравнения и выступающей в качестве фактора.rnВ нашей задаче система уравнений для описания выдвигаемых рабочих гипотез будет иметь следующий вид:rnrn rn2.Выполним идентификацию каждого структурного уравнения и всей системы для ответа на вопрос – имеют ли решения каждое из уравнений и система в целом. Воспользуемся счётным правилом, по которому в каждом уравнении системы необходимо сравнить HY - число эндогенных переменных в данном уравнении и Dx - число отсутствующих в уравнении экзогенных переменных из общего для всей системы их перечня. Для удобства анализа представим результаты в таблице.rnРезультаты идентификации структурных уравнений и всей системыrnНомер уравнения Число эндогенных переменных в уравнении, HY Число экзогенных переменных из общего их списка, отсутствующих в уравнении, Dx Сравнение параметров HY и Dx + 1 Решение об идентификации уравненияrn1 3 3 3 1+1 НеидентифицированоrnВся система уравнений в целом Неидентифицированаrn.rn3. В том случае, когда хотя бы одно из уравнений не имеет решения, система в целом также не имеет решения. Если подобный результат нас не устраивает, необходимо внести коррективы в исходные рабочие гипотезы и отредактировать их таким образом, чтобы идентификация была возможна. rn4. Теоретический анализ содержания взаимосвязи, отражённой в уравнении № 3, позволяет рассмотреть варианты возможной корректировки. Во-первых, из правой части может быть исключёна одна из экзогенных переменных. Скорее всего, ею может оказаться x4, так как по своему экономическому смыслу она менее тесно связана со среднемесячным душевым доходом населения региона.rnВо-вторых, возможна корректировка путём исключения из правой части уравнения эндогенной переменной Y2.rnПри корректировке рабочей гипотезы путём удаления x3 уравнение №1 становится точно идентифицированным, а вся система – сверхидентифицированной.rn5. Для поиска решений сверхидентифицированной системы уравнений применяются: а) косвенный метод наименьших квадратов (КМНК) для решения точно идентифицированных уравнений и б) двухшаговый МНК (ДМНК) для поиска решений сверхидентифицированных уравнений. rn rn Задача № 5.rnПо территориям Сибирского и Уральского федеральных округов России имеются данные за 2000 год о следующих показателях:rnY1 –валовой региональный продукт, млрд. руб.rnY2 - розничный товарооборот, млрд. руб.rn - основные фонды в экономике, млрд. руб.rn -инвестиции в основной капитал, млрд. руб.rn - среднедушевые расходы населения за месяц, тыс. руб.rnИзучения связи социально-экономических показателей предполагает проверку следующих рабочих гипотез:rn rnДля их проверки выполнена обработка фактических данных и получена следующая система приведённых уравнений:rnrn rnrnЗадание: rn1.Построить систему структурных уравнений и провести её идентификацию;rn2.Проанализировать результаты решения приведённых уравнений;rn3.Используя результаты построения приведённых уравнений, рассчитать параметры структурных уравнений (косвенный МНК); проанализируйте результаты;rn4.Укажите, каким образом можно применить полученные результаты для прогнозирования эндогенных переменных и rnrnРешение.rn1. Построение системы структурных уравнений выполняется в соответствии с рабочими гипотезами:rn rn2. В соответствии со счётным правилом оба уравнения и система в целом являются точно идентифицированными, и это означает, что они имеют единственное решение, которое может быть получено косвенным МНК (КМНК).rnНомер уравнения Число эндогенных переменных в уравнении, HY Число экзогенных переменных из общего их списка, отсутствующих в уравнении, Dx Сравнение параметров HY и Dx + 1 Решение об идентификации уравненияrn1 2 1 2 = 1+1 точно идентифицированоrn2 2 1 2 =1+1 точно идентифицированоrnСистема уравнений в целом точно идентифицированоrnrn3. Процедура КМНК состоит в том, чтобы путём преобразования результатов решения приведённых уравнений получить искомые структурные уравнения. Используемый приём подстановок обеспечивает получение точных результатов только в том случае, если выполняемые преобразования точны и безошибочны. Чтобы получить первое структурное уравнение из первого, приведённого необходимо отсутствующий в структурном уравнении признак выразить через Y2, используя результаты второго приведённого уравнения. То есть:rn rnПосле подстановки значения в первое приведённое уравнение и преобразования подобных членов, получаем следующий результат:rn rnrnКак видим, полученный результат соответствует исходной рабочей гипотезе. Анализ показывает, что стоимость ВРП находится в прямой зависимости от розничного товарооборота, от размера инвестиций в экономику и от уровня среднедушевых расходов населения за месяц. Указанные переменные объясняют 94,4% вариации результата, а характеристики установленной зависимости являются статистически значимыми и надёжными, так как rn для .rnСледовательно, есть основания для отклонения нулевой гипотезы о случайной природе выявленной зависимости.rnАналогично выполняем преобразования для определения параметров второго структурного уравнения. Выразим отсутствующий в уравнении через Y1, используя результаты построения первого приведённого уравнения. То есть:rn .rnПосле подстановки значения во второе приведённое уравнение и преобразования подобных членов, получаем следующий результат:rn rnУравнение описывает линейную зависимость розничного товарооборота от стоимости ВРП, основных фондов в экономике, от уровня среднедушевых расходов населения за месяц. Данный перечень переменных объясняет 96,3% вариации оборота розничной торговли, а соотношение позволяет отклонить нулевую гипотезу о случайной природе выявленной зависимости.rn4. Для выполнения прогнозных расчётов и наиболее простым является вариант, по которому прогнозные значения экзогенных переменных ( ) подставляются в приведённые уравнения. Точность и надёжность прогнозов в этом случае зависит от качества приведённых моделей и от того, как сильно отличаются прогнозные значения экзогенных переменных от их средних значений.rn rnЗадача № 6.rnИмеются сведения о среднем размере земельного участка крестьянского (фермерского) хозяйства Qt, га за период с 1993 по 2001 год (на конец года) в Российской Федерации.:rnrnГоды Qt Годы Qtrn1993 42 1998 54rn1994 44 1999 62rn1995 47 2000 67rn1996 48 2001 75rn1997 50 rn rnrnЗадание:rn1. Постройте график фактических уровней динамического ряда -Qtrn2. Рассчитайте параметры уравнения линейного тренда: .rn3. Оцените полученные результаты:rn- с помощью показателей тесноты связи ( r и ρ ; r2 и ρ2 );rn- значимость модели тренда (F-критерий);rn- качество модели через корректированную среднюю ошибку аппроксимации , а также через коэффициент автокорреляции отклонений от тренда - rn4. Выполните по ней прогноз до 2003 года, рассчитайте ошибки прогноза, доверительный интервал прогноза и оцените его точность.rn5. Проанализируйте полученные результаты.rnРешение:rn1. Постройте график фактических уровней динамического ряда -QtrnОбщее представление о форме основной тенденции в уровнях ряда даёт график их фактических значений.rn rnrn2. Рассчитайте параметры уравнения линейного тренда: .rnПараметры рассчитаем с помощью определителей второго порядка, используя формулы, Расчёт определителя системы выполним по формуле:rn 540;rn Расчёт определителя свободного члена уравнения выполним по формуле:rn 18675.rn Расчёт определителя коэффициента регрессии выполним по формуле:rn 2133.rn Расчёт параметров уравнения регрессии даёт следующие результаты:rn ; .rnВ конечном счёте, уравнение линейного тренда имеет вид: rn .rnДля оценки тесноты связи рассчитаем линейный коэффициент парной корреляции:rn rnУравнение линейного тренда детерминирует 91,96% вариации численности занятых.rnГоды Qt t T2 Qt*t Qt расч. DQt (dQt)2 rnrnА 1 2 3 4 5 6 7 8rn1993 42 1 1 42 38,533 3,467 12,018 6,380rn1994 44 2 4 88 42,483 1,517 2,300 2,791rn1995 47 3 9 141 46,433 0,567 0,321 1,043rn1996 48 4 16 192 50,383 -2,383 5,680 4,387rn1997 50 5 25 250 54,333 -4,333 18,778 7,975rn1998 54 6 36 324 58,283 -4,283 18,347 7,883rn1999 62 7 49 434 62,233 -0,233 0,054 0,429rn2000 67 8 64 536 66,183 0,817 0,667 1,503rn2001 75 9 81 675 70,133 4,867 23,684 8,957rnИтого 489 45 285 2682 489,000 0,000 81,850 41,350rnСредняя 54,333 5 — — — — — 4,594rnСигма 10,635 2,582 — — — — — —rnДисперсия, D 113,111 6,667 — — — — — —rnrn rnСредняя ошибка аппроксимации очень невелика ( = 4,594%), что указывает на высокое качество модели тренда и возможность её использования для решения прогнозных задач. rnФактическое значение F-критерия и сравнение с 5,59 его табличного значения позволяет сделать вывод о высокой степени надёжности уравнения тренда.rn Для дополнительной проверки качества тренда выполним расчёт коэффициента корреляции отклонений фактических уровней от рассчитанных по уравнению тренда. Если будет установлено отсутствие связи отклонений, это укажет на их случайную природу, то есть на то, что тренд выбран, верно, что он полностью исключил основную тенденцию из фактических уровней ряда и что он сформировал случайный значения отклонений.rnВыполним расчёт в таблице. Поместим во второй графе фактические отклонения от тренда , для удобства расчёта обозначим их через Y. В соседней графе поместим эти же отклонения, но, сместив их относительно первой строки, на один год вниз; обозначим их через и рассмотрим в качестве фактора X. Линейный коэффициент корреляции отклонений рассчитаем по формуле: rnИспользуем значения определителей второго порядка для расчёта коэффициента регрессии с1, который отражает силу связи отклонений и . Получены следующие значения определителей:rn rnОтсюда . При этом, коэффициент корреляции отклонений составит: rn rnВ данном случае выявлена заметная связь, существенность которой подтверждает сравнение фактического и табличного значений F- критерия: . Следовательно, нулевая гипотеза о случайной природе отклонений может быть принята, отклонения не связаны между собой и являются случайными величинами. rnТаблица rn (Y)rn (X)rn rn rnrn 3,47 — — —rn1 1,52 3,47 5,26 12,02rn2 0,57 1,52 0,86 2,30rn3 -2,38 0,57 -1,35 0,32rn4 -4,33 -2,38 10,33 5,68rn5 -4,28 -4,33 18,56 18,77rn6 -0,23 -4,28 1,00 18,34rn7 0,82 -0,23 -0,19 0,05rn8 4,87 0,82 3,98 0,67rnИтого -3,46 -4,86 38,44 58,16rnСредняя -0,49 -0,69 — —rnСигма 3,13 2,81 — —rnrnПри выполнении прогнозов на 2002 и 2003 годы подставим в уравнение прогнозные значения фактора, 10, 11, что позволяет получить прогнозные значения о среднем размере земельного участка крестьянского (фермерского) хозяйства: га, га.rnРассчитаем ошибки прогноза, доверительный интервал прогноза и оценим его точность.rnРассчитаем интегральную ошибку прогноза - , которая формируется как сумма двух ошибок: из ошибки прогноза как результата отклонения прогноза от уравнения регрессии - и ошибки прогноза положения регрессии - . То есть, .rnВ нашем случае , где k- число факторов в уравнении, которое в данной задаче равно 1. Тогда (га).rnОшибка положения регрессии составит: =rn= = 0,267(га).rnИнтегральная ошибка прогноза составит: = = 3,428 (га).rnПредельная ошибка прогноза, которая не будет превышена в 95% возможных реализаций прогноза, составит: = 2,37*3,428 = 8,124 ≈ 8,0 (га). Табличное значение t-критерия для уровня значимости α=0,05 и для степеней свободы n-k-1 = 9-1-1=7 составит 2,37. Следовательно, ошибка большинства реализаций прогноза не превысит га.rnЭто означает, что фактическая реализация прогноза будет находиться в доверительном интервале . Верхняя граница доверительного интервала составит rn = 78,033 + 8,0 = 86,033(га).rnНижняя граница доверительного интервала составит: = 78,033 - 8,0 = 70,033(га).rnОтносительная величина различий значений верхней и нижней границ составит: = раза. Это означает, что верхняя граница в 1,23 раза больше нижней границы, то есть точность выполненного прогноза достаточно велика и его надёжность на уровне 95% оценивается как высокая.ВведениеЛитература'
Уточнение информации

+7 913 789-74-90
info@zauchka.ru
группа вконтакте