Рис. 4.4
В открывшемся окне выделяем переменную и красной стрелкой удаляем ее из независимых переменных.
Рис. 4.5
Обновленная модель представлена на рис. 4.6.
Рис. 4.6
Как видно из распечатки, все коэффициенты регрессии в обновленной модели значимы на 1 %-ном уровне (следовательно, и на 5 %-ном уровне они тоже значимы). Возможности t-теста не ограничиваются только проверкой незначимости коэффициентов при регрессорах. На самом деле проверка незначимости коэффициента является частным случаем проверки равенства коэффициента при регрессоре конкретному значению [2, 3].
Разберем это на примере. Проверим, а можем ли мы округлить коэффициент при переменной до 0,2. Сформулируем гипотезы для проверки этого предположения:
Для проверки такого рода гипотезы уже нельзя воспользоваться рассчитанным в GRETL значением t-статистики, а также р-значением, поэтому вычислим значение t-статистики для переменной самостоятельно:
. Значение критической точки Стьюдента составит
.
Сравниваем расчетную статистику и критическую и получаем, что , то есть (|–0,56 | < 1,96). В этом случае, мы можем принять нулевую гипотезу и округление коэффициента перед
до 0,2 будет статистически корректно. Аналогичные гипотезы мы можем проверять для остальных коэффициентов регрессии.
Проверить, может ли коэффициент при регрессоре равняться заданному значению, позволяет также доверительный интервал [2, 3].
Используя данные из распечатки на рис. 4.6, можно построить доверительные интервалы для всех коэффициентов самостоятельно либо воспользоваться встроенной функцией GRETL для построения доверительного интервала.
Для этого в окне модели вызовем пункт меню Анализ – Доверительные интервалы для коэффициентов.
Рис. 4.7
Результатом работы данной функции является следующее окно (рис. 4.8).
Рис. 4.8
Истинное значение коэффициента при переменной с вероятностью 95 % накрывается интервалом
.
Нужно обратить внимание на то, что с помощью доверительного интервала можно проверять незначимость коэффициентов при регрессорах. В случае, если доверительный интервал накрывает 0 (то есть истинное значение коэффициента может принимать нулевое значение), можно сделать вывод о том, что коэффициент не значим.
Еще одна возможность для проверки гипотез с помощью теста Стьюдента – это односторонние гипотезы [2, 3].
Разберем, как проводится односторонний t-тест на примере. Проверим, верно ли, что коэффициент перед переменной можно считать большим 0,2.
Значение расчетной статистики для этого теста будет такое же, как и в предыдущем тесте (проверка равенства коэффициента заданному значению). Критическая точка составит . Сравнивая расчетное значение статистики с критическим, получаем
, то есть –0,56 < 1,65. Значит, гипотеза H0 принимается.
По сути, все разновидности t-теста и построение доверительного интервала для коэффициента – это две стороны одной медали. Полезные результаты можно получать и тем и другим способом, выбор способа ответа на вопросы о незначимости коэффициента при регрессоре и соотношения коэффициента регрессора с заданным значением возлагается на исследователя.
В рассматриваемой нами модели зависимости заработной платы после проверки незначимости коэффициентов при отдельных регрессорах осталось две независимых переменных: образование и опыт работы у текущего работодателя. Однако с экономической точки зрения очевидно, что на уровень заработной платы сотрудника могут влиять и некоторые другие факторы, например, уровень интеллекта (IQ), возраст, образование и заработок родителей, общий уровень знаний и проч. Когда мы отбираем регрессоры для модели, мы, с одной стороны, должны руководствоваться соображениями экономической обоснованности и осмысленности, а с другой – нужно иметь в виду и эконометрические аспекты. Так, например, нужно помнить, что если не включить существенные регрессоры в модель, оценка для дисперсии ошибок модели получится смещенная, и тогда тесты на незначимость будут работать некорректно. Если же включить несущественную переменную, оценки для коэффициентов хоть и будут несмещенные, но получатся неэффективными. Таким образом, отбирая регрессоры для модели, нужно учитывать как содержательные аспекты, так и эконометрические.
Предположим, что с точки зрения экономического смысла мы определились с регрессорами и решили построить следующую модель [файл с данными wage2.gdt]:
где – средняя заработная плата в месяц в долларах,
– среднее число рабочих часов в неделю,
– уровень IQ в баллах,
– индекс знания своей области деятельности в баллах,
– уровень образования в годах,
– опыт работы в годах,
– опыт работы у текущего работодателя в годах,
– образование матери,
– образование отца2.
На рис. 5.1 дана распечатка оцененной регрессии. По распечатке можно сделать вывод, что в целом регрессия значима, но не все коэффициенты значимы по отдельности.
На 5 %-ном уровне значимости сразу несколько коэффициентов перестают быть значимыми. Если бы не значим был лишь один коэффициент в модели, его можно было бы исключить, но в случае незначимости нескольких коэффициентов можно ли исключить соответствующие регрессоры из модели на том основании, что коэффициент каждого из них в отдельности не значим на 5 %-ном уровне? Чтобы ответить на этот вопрос, нужно вспомнить о том, что существенные регрессоры исключать из модели некорректно, но оставлять несущественные регрессоры в модели тоже не является правильным. Поэтому для того, чтобы понять, можно ли исключить все регрессоры, чьи коэффициенты не значимы на 5 %-ном уровне, или нужно исключить только некоторые из них и какие именно, необходимо провести тест на совместную незначимость коэффициентов при регрессорах [2, 3].
Данный тест можно проводить несколькими способами в GRETL, рассмотрим каждый из них на примере рассматриваемой модели.
Сформулируем гипотезу о совместной незначимости регрессоров ,
.
не так
Результаты оценивания регрессии без ограничения приведены на рис. 5.1, сумма квадратов остатков данной модели .
Рис. 5.1
Оценим регрессию с ограничением, то есть исключим из нее переменные с коэффициентами, подозрительными на совместную незначимость. Для этого можно, очевидно, по новой оценить модель, но можно и в существующей модели выбрать пункт меню Правка – Изменить модель и удалить регрессоры с коэффициентами, подозрительными на совместную незначимость. Результат оценивания модели с ограничением представлен на рис. 5.2.
Сумма квадратов остатков в модели с ограничением .
Далее рассчитаем значение F-статистики:
Критическое значение статистики составляет , таким образом,
, гипотеза о совместной незначимости коэффициентов при этих регрессорах на 5 %-ном уровне значимости принимается. Оба регрессора могут быть исключены из модели, и тогда окончательной спецификацией будет модель с ограничением:
Рис. 5.2
Тест на совместную незначимость коэффициентов также можно провести автоматически. Для этого, после того как было оценено исходное уравнение, в меню окна результатов нужно выбрать Тесты – Избыточные переменные.
Рис. 5.3
После этого в меню можно выбрать одну из опций оценивания: оценить сокращенную модель (аналог того теста, который был показан выше) или проверить избыточность переменных с использованием теста Вальда [9].
Результат оценивания с использованием сокращенной модели представлен на рис. 5.4.
Рис. 5.4
При данном методе проверки также рассчитывается F-статистика и ее значение совпадает с тем, что было получено вручную. При этом приводится оцененный вариант короткой модели (модели с ограничением). Нулевая гипотеза состоит в том, что указанные на этапе тестирования переменные нулевые. Для проверки этой гипотезы можно воспользоваться рассчитанным значением F-статистики и сравнить его с критической точкой, как это было проделано, а можно обратить внимание на р-значение = 0,254184, то есть вероятность ошибиться, отвергнув нулевую гипотезу о незначимости коэффициентов, составляет примерно 0,26. Так как р-значение > 0,05 (больше зафиксированного уровня значимости), мы принимаем нулевую гипотезу, указанные коэффициенты не значимы на 5 %-ном уровне, и соответствующие регрессоры нужно исключить из модели. Корректный вариант модели – модель с ограничением.
Бесплатный фрагмент закончился.