Читать контрольная по менеджменту: "Построение уравнения множественной регрессии" Страница 3
ЛИНЕЙН Таким образом, в классе однофакторных регрессионных моделей наиболее информативным предиктором (предсказателем) является x1 - общая площадь квартиры. Включим эту переменную в выстраиваемую методом включения модель.
Вычислим скорректированный коэффициент детерминации:=0.8701,
где k-количество факторов.
-й шаг (k=2). Среди всевозможных пар (х1 , хj ), j = 2, 3, 4, 5, выбирается наиболее информативная пара:
Последовательно применяем табличную функцию ЛИНЕЙН к различным парам:
(х1 , х2) = 0.8684, (х1 , х3) = 0.8709,
(х1 , х4 ) = 0.8681, (х1 , х5) = 0.9147.
Очевидно, что наиболее информативной парой является (х1, х5 ), которая дает
С включением параметра х5 коэффициент детерминации вырос, следовательно, это правильное решение. Линейное уравнение с учетом факторов х1 и х5 имеет вид :
(х1, х5) = 1,9787 + 0.4971 х1 - 0,4286 х5
Используя надстройку «Регрессия», проведем анализ значимости найденных коэффициентов.
Рис. 5 Фрагмент отчета регрессии по двум переменнымСтолбец t-статистика содержит наблюдаемые значения t-критерия Стьюдента . Столбец «P-значение» используется для проверки гипотезы (о незначимости i-го коэффициента регрессии) с помощью критерия Стьюдента. Столбец содержит вероятности того, что в силу случайных причин принимает это или большее значение, хотя коэффициент регрессии bi =0. «P-значение» сравнивается с выбранным уровнем значимости α, если «P-значение» больше или равно α, то гипотеза подтверждается и коэффициент незначим, в противоположном случае коэффициент существенно отличен от 0, т.е. значим. Рассмотрев столбец «P-значение», приходим к выводу: два коэффициента при независимых переменных (х1 , х5) отличаются от нуля при уровне значимости a = 0.05. Коэффициент «Y-пересечение» (1,9787) не значим, и его следует исключить из уравнения. Таким образом, уравнение фактически имеет вид:
(х1, х5) = 0.4971 х1 - 0,4286 х5
-й шаг (k = 3). Попытаемся добавить третью переменную в наше уравнение регрессии. Среди всевозможных троек (х1 , х5 , хj), j = 2, 3, 4, выбираем аналогично наиболее информативную: (х1, х5, х2), которая дает (3) = 0.9139, что меньше, чем (2) = 0.9147.
Рис. 6 Применение функции ЛИНЕЙН для нахождения третьего фактораСледовательно, третью переменную в модель включать нецелесообразно, т.к. она понижает значение. Этот же результат получим, применив надстройку «Регрессия» Отметим, что коэффициент при x2 не значим при уровне значимости 0,05.
Рис. 7 Фрагмент отчета регрессии по трем переменным Уравнение
(х1, х5) = 0.4971 х1 - 0,4286 х5 адекватно описывает зависимость стоимости квартиры от влияющих на нее факторов, и может быть использовано для анализа и прогноза. Все коэффициенты при неизвестных в нем значимы.
Пункт 4
Для применения метода наименьших квадратов требуется, чтобы дисперсия остатков была гомоскедастичнной. Это значит, что для каждого значения фактора остатки имеют одинаковую дисперсию. Если это условие не соблюдается, то имеет место гетероскедастичность.
Рассмотрим графики остатков для переменных x1 и x5, полученные при построении уравнения регрессии с помощью надстройки «Анализ данных - Регрессия» (рис.8).
Визуальный анализ остатков (ошибок аппроксимации) по графикам не может однозначно исключить наличие гетероскедастичности.
Рис. 8 Графики остатков Нарушение гомоскедастичности может
Похожие работы
Интересная статья: Основы написания курсовой работы

(Назад)
(Cкачать работу)