Задача 1. В базе
данных магазина, торгующего подержанными автомобилями, содержится информация об
их потребительских свойствах и ценах.
Для анализа зависимости цены
автомобиля Y от его возраста X1 и мощности двигателя X2
из базы данных выбраны сведения
о 16 автомобилях. Эти сведения
приведены в таблице 1.
Таблица 1
Номер автомобиля
i
|
Цена (тыс.у.е.)
yi
|
Возраст (лет)
xi1
|
Мощность двигателя (л.с.)
xi2
|
1
|
9,2
|
5,0
|
113
|
2
|
3,5
|
7,0
|
70
|
3
|
8,7
|
5,0
|
115
|
4
|
9,5
|
4,0
|
87
|
5
|
10,6
|
4,0
|
106
|
6
|
6,0
|
6,0
|
68
|
7
|
10,7
|
4,0
|
100
|
8
|
10,7
|
5,0
|
131
|
9
|
10,2
|
4,0
|
107
|
10
|
9,8
|
4,0
|
91
|
11
|
6,2
|
7,0
|
105
|
12
|
5,5
|
7,0
|
105
|
13
|
8,8
|
5,0
|
111
|
14
|
5,2
|
7,0
|
94
|
15
|
7,2
|
6,0
|
94
|
16
|
10,8
|
4,0
|
114
|
1. Парные зависимости
1.1. Построить поля рассеяний для
цены Y и возраста автомобиля X1, а также для цены Y и мощности
двигателя X2.
На основе их визуального анализа
выдвинуть гипотезы о виде статистической зависимости Y от X1 и Y от
X2 и записать их математически.
1.2. Методом наименьших квадратов
найти оценки линейных уравнений регрессии:
y
= α0 + α1x1 y = β0 + β1x2
1.3. С помощью коэффициентов
парной корреляции проанализировать тесноту линейной связи между ценой и
возрастом автомобиля,
а также между ценой и мощностью
двигателя. Проверить их значимость с надежностью 0,9.
1.4. Проверить статистическую
значимость параметров и уравнений регрессии с надежностью 0,9.
1.5. Построить доверительные
полосы надежности 0,95 для среднего значения цены автомобиля в зависимости от его
возраста,
а также от мощности двигателя.
Изобразить графически линии регрессии и доверительные полосы вместе с полями рассеяний.
1.6. На продажу поступила
очередная партия однотипных автомобилей. Их возраст 3 года, мощность двигателя 165 л.с.
Рассчитать точечный и
интервальный прогноз среднего значения цены поступивших автомобилей в
зависимости от возраста и мощности двигателя с доверительной вероятностью 0,95.
2. Множественная зависимость
2.1. По методу наименьших
квадратов найти оценки коэффициентов множественной линейной регрессионной модели
Y = α0
+ α1X1 + α2X2 + ε
2.2. Проверить статистическую
значимость параметров и уравнения множественной регрессии с надежностью 0,9.
2.3. Рассчитать точечный и
интервальный прогноз среднего значения цены поступивших автомобилей возраста 3
года и
мощностью двигателя 165 л.с. с доверительной вероятностью 0,95.
3. Экономическая интерпретация
На основе полученных в пунктах 1
и 2 статистических характеристик провести содержательный экономический анализ
зависимости цены автомобиля от
его возраста и мощности двигателя.
Задача 2. Временной
ряд
В базе данных магазина также
содержится информация об объеме ежемесячных продажах автомобилей за прошлый
год,
представленная в таблице 2.
Таблица 2
Месяц,
t
|
Объем продаж (тыс.у.е.)
zt
|
1
|
279
|
2
|
325
|
3
|
303
|
4
|
297
|
5
|
326
|
6
|
370
|
7
|
462
|
8
|
381
|
9
|
347
|
10
|
381
|
11
|
471
|
12
|
513
|
1. Представить графически
ежемесячные объемы продаж автомагазина. На основе визуального анализа
построенного графика
выдвинуть гипотезу о виде
статистической зависимости объема продаж от времени и записать её математически.
2. Методом наименьших квадратов
найти оценку уравнения линейного тренда
Zt =
γ0 + γ1t
3. Для линии тренда построить
доверительную полосу надежности 0,975. Нарисовать ее на графике вместе с линией
тренда и исходным временным рядом.
4. С помощью уравнения тренда
найти точечный и интервальный прогноз (надежности 0,975) среднего объема продаж
для t =15.
Задача 3. Проверка
моделей на автокорреляцию и мультиколлинеарность
1. Для регрессионных моделей:
Y = α0
+ α1X1 + α2X2 + ε и
Zt = γ0
+ γ1t + ε
с помощью критерия
Дарбина-Уотсона проверить наличие или отсутствие автокорреляции на уровне
значимости 0,05.
2. Для регрессионной модели
Y = α0
+ α1X1 + α2X2 + ε
проверить наличие или отсутствие
мультиколлинеарности, используя:
а) парный коэффициент корреляции;
б) критерий «хи-квадрат» χ2
на уровне значимости 0,05.