Калькулятор критерия Вальда - Статистическая значимость

Выполните критерий Вальда, чтобы определить, является ли оценка параметра статистически значимой: введите β̂, β₀, SE и α для мгновенного результата.

Введите оценку параметра, гипотетическое значение, стандартную ошибку и уровень значимости. Калькулятор вернет статистику Вальда, z-оценку, p-значение и решение.

Калькулятор критерия Вальда - Статистическая значимость
Выполните критерий Вальда, чтобы определить, является ли оценка параметра статистически значимой: введите β̂, β₀, SE и α для мгновенного результата.

О калькуляторе критерия Вальда

Критерий Вальда — это параметрический статистический тест, названный в честь статистика Абрахама Вальда. Это один из трех классических критериев проверки гипотез в оценивании максимального правдоподобия, наряду с критерием отношения правдоподобий и критерием счета (множителя Лагранжа). Критерий Вальда встречается чаще всего, потому что требует только самой оценки и ее стандартной ошибки — обе величины обычно выводятся статистическим программным обеспечением — без необходимости знать полную функцию правдоподобия. Идея критерия Вальда проста. Если оценка параметра β̂ находится далеко от гипотетического значения β₀ относительно своей точности (измеряемой стандартной ошибкой SE), то нулевая гипотеза H₀: β = β₀, скорее всего, неверна. Статистика Вальда равна W = ((β̂ − β₀) / SE)², то есть квадрату z-оценки. При нулевой гипотезе и достаточно большой выборке W имеет распределение хи-квадрат с одной степенью свободы. Эквивалентно, z-оценка со знаком z = (β̂ − β₀) / SE имеет стандартное нормальное распределение, поэтому двустороннее p-значение равно 2 · (1 − Φ(|z|)), где Φ — функция распределения стандартного нормального закона. p-значение отвечает на вопрос: если нулевая гипотеза верна, какова вероятность наблюдать тестовую статистику, по крайней мере столь же экстремальную, как фактически вычисленная? Малое p-значение (обычно ниже уровня значимости α, часто 0.05 или 0.01) дает свидетельство против H₀. Если p < α, результат называют статистически значимым, и мы отклоняем нулевую гипотезу. Если p ≥ α, мы не отклоняем ее: у нас недостаточно доказательств, чтобы заключить, что параметр отличается от β₀, хотя это не означает, что H₀ истинна. Критерий Вальда широко распространен в прикладной статистике. В линейной и логистической регрессии t-статистики, сообщаемые для каждого коэффициента, по сути являются z-оценками Вальда, а соответствующие p-значения проверяют, отличается ли каждый коэффициент значимо от нуля. В эконометрике критерий Вальда используется для одновременной проверки совместных гипотез о нескольких коэффициентах (с использованием расширений матричной алгебры). В анализе выживаемости он проверяет, является ли ковариата значимым предиктором интенсивности риска. В генетике полногеномные ассоциативные исследования используют статистики типа Вальда для проверки миллионов однонуклеотидных полиморфизмов. Известное ограничение критерия Вальда состоит в том, что он может давать разные результаты в зависимости от параметризации, поскольку опирается на локальную квадратичную аппроксимацию правдоподобия. Для малых выборок часто предпочитают критерий отношения правдоподобий, так как он точнее. Критерий Вальда наиболее надежен, когда размер выборки велик, оценка приблизительно нормально распределена (то есть выполняются асимптотические условия), а стандартная ошибка хорошо оценена.

Примеры критерия Вальда

Три реалистичных сценария из экономики, медицины и общей статистики, показывающие критерий Вальда в действии.

ВводРешениеПодробности
β̂=2.5, β₀=0, SE=1.1, α=0.05Отклонить H₀z = 2.27, W = 5.17, p ≈ 0.023. Оценка находится более чем в 2 стандартных ошибках от нуля, поэтому мы отклоняем нулевую гипотезу при α = 0.05.
β̂=0.08, β₀=0, SE=0.02, α=0.05Отклонить H₀Коэффициент образования: z = 4.0, p < 0.001. Дополнительный год образования имеет высокозначимый ненулевой эффект на заработную плату.
β̂=−0.5, β₀=0, SE=0.2, α=0.01Не отклонять H₀Эффективность препарата при строгом α=0.01: z = −2.5, p ≈ 0.012. Эффект значим при α=0.05, но не при более строгом 1%-м пороге.

Как пользоваться калькулятором критерия Вальда

  1. Введите оценку параметра β̂ из результата регрессии или статистической модели.
  2. Введите гипотетическое значение β₀ — обычно 0, когда проверяется, является ли коэффициент ненулевым.
  3. Введите стандартную ошибку SE оценки, указанную в том же статистическом выводе.
  4. Задайте уровень значимости α: используйте 0.05 для традиционного порога 5% или 0.01 для более строгого порога 1%.
  5. Нажмите Рассчитать, чтобы получить статистику Вальда, z-оценку, двустороннее p-значение и решение об отклонении или неотклонении.

Вопросы и ответы о критерии Вальда

Что измеряет критерий Вальда?
Критерий Вальда измеряет, насколько далеко оценка параметра находится от гипотетического значения, в единицах стандартной ошибки. Он проверяет, достаточно ли это расстояние велико, чтобы при заданном уровне значимости заключить, что истинный параметр отличается от гипотетического значения.
В чем разница между критерием Вальда и t-критерием?
В больших выборках они по сути эквивалентны: оба сравнивают оценку с нулевым значением в единицах стандартной ошибки. Главное отличие в том, что t-критерий использует t-распределение, учитывая неопределенность оценки дисперсии, тогда как критерий Вальда использует нормальное распределение и поэтому является асимптотическим тестом, лучше подходящим для больших выборок.
Почему нулевая гипотеза обычно β₀ = 0?
Проверка против нуля отвечает на вопрос, оказывает ли предиктор вообще какой-либо эффект. В регрессии коэффициент, равный нулю, означает, что переменная нерелевантна. β₀ = 0 — самый распространенный вариант, но можно проверять любое значение, например, чтобы узнать, равен ли параметр теоретически предсказанному значению, такому как 1 или −0.5.
Что означает не отклонять H₀?
Не отклонять H₀ означает, что данные не дают достаточных доказательств, чтобы заключить, что параметр отличается от гипотетического значения. Это не доказывает, что H₀ истинна. Результат может отражать действительно нулевой эффект или недостаточную статистическую мощность из-за малой выборки либо большой стандартной ошибки.
Когда лучше использовать критерий отношения правдоподобий?
Критерий отношения правдоподобий предпочтителен, когда размеры выборок малы, параметр близок к границе допустимого диапазона или результаты критерия Вальда сильно зависят от выбранной параметризации. Для больших выборок и гладко распределенных оценок критерий Вальда и критерий отношения правдоподобий дают почти одинаковые p-значения.
Какой уровень значимости использовать?
Традиционный порог — α = 0.05 (5%), что означает готовность принять 5%-ю вероятность ошибочного отклонения истинной нулевой гипотезы. Для более строгих требований — одобрение медицинских устройств, геномика или физика — используют α = 0.01 или даже 0.001. В поисковых исследованиях иногда принимают α = 0.10. Выбор следует сделать до просмотра данных.