Калькулятор p-hat - выборочная доля p̂ и q̂
Рассчитайте выборочную долю p̂ (p-hat) и ее дополнение q̂ по размеру выборки и числу успехов в любом статистическом исследовании.
Введите общий размер выборки (n) и число успехов (x), чтобы сразу получить p̂ и q̂ в виде десятичных чисел и процентов.
Калькулятор p-hat - выборочная доля p̂ и q̂
Рассчитайте выборочную долю p̂ (p-hat) и ее дополнение q̂ по размеру выборки и числу успехов в любом статистическом исследовании.
О калькуляторе p-hat
В выводной статистике выборочная доля p̂ (произносится «p-hat») — это доля единиц в выборке, которые обладают определенным признаком или соответствуют заданному критерию. Это одна из самых базовых статистик в прикладных исследованиях: на ней основаны доверительные интервалы для долей, проверки гипотез о долях и расчеты размера выборки для опросов и клинических испытаний.
Формула проста: p̂ = x / n, где x — число «успехов» (наблюдений с интересующим признаком), а n — общий размер выборки. Дополнение q̂ = 1 − p̂ представляет долю выборки, не имеющую этого признака. Вместе p̂ и q̂ в сумме дают ровно 1 и совместно описывают бинарное разбиение выборки.
Основная цель p̂ — оценить истинную долю в генеральной совокупности p, которая обычно неизвестна. Поскольку выборка является лишь подмножеством совокупности, p̂ является случайной величиной: ее значение немного меняется от одной выборки к другой. Центральная предельная теорема гарантирует, что при достаточно большом n (обычно np̂ ≥ 5 и nq̂ ≥ 5) выборочное распределение p̂ приблизительно нормально со средним p и стандартной ошибкой √(p(1−p)/n). Эта нормальная аппроксимация лежит в основе наиболее распространенных доверительных интервалов для долей и z-критериев для долей.
Практические применения p̂ охватывают все количественные области. В политических опросах организации отбирают несколько тысяч вероятных избирателей и сообщают p̂ как оценочную поддержку кандидата, обычно с погрешностью (± 2–3%), выведенной из стандартной ошибки. В производственном контроле качества инженер отбирает 200 единиц из партии и вычисляет долю дефектов p̂, чтобы решить, находится ли уровень брака в допустимых пределах. В клинических испытаниях первичной конечной точкой часто является доля пациентов, ответивших на лечение; p̂ в группе лечения по сравнению с p̂ в контрольной группе формирует основу главного статистического сравнения. В A/B-тестировании цифровых продуктов p̂ — это коэффициент конверсии для каждого варианта.
Важно отличать p̂ от среднего. Среднее обобщает непрерывные числовые данные (средний рост, средний доход), а p̂ обобщает бинарные категориальные данные (успех или неудача, да или нет, дефектный или недефектный). Обе величины являются точечными оценками, но следуют разным выборочным распределениям и требуют разных формул для доверительных интервалов и проверок гипотез.
При сообщении p̂ всегда указывайте вместе с ней доверительный интервал и размер выборки n. Значение p̂ = 0.6 намного информативнее в виде «0.6 (95% CI: 0.57 – 0.63, n = 1,000)», чем само по себе. Доверительный интервал показывает точность оценки и позволяет читателям понять, может ли истинная доля правдоподобно быть выше или ниже любого важного для них порога. Без n и CI значение p̂ является неполным результатом.
Решенные примеры
Три реальных сценария, показывающих, как рассчитывается p̂ и что означают результаты в контексте.
| Ввод (n, x) | p̂ | Контекст |
|---|---|---|
| n = 1000, x = 550 | p̂ = 0.55 (55%) | Предвыборный опрос: 550 из 1,000 избирателей поддерживают кандидата A. p̂ = 0.55, q̂ = 0.45. |
| n = 200, x = 15 | p̂ = 0.075 (7.5%) | Контроль качества: 15 дефектных лампочек в выборке из 200. Доля дефектов p̂ = 7.5%, доля годных q̂ = 92.5%. |
| n = 120, x = 80 | p̂ = 0.6667 (66.67%) | Клиническое испытание: 80 из 120 пациентов положительно ответили на новый препарат. Частота ответа p̂ ≈ 0.667. |
Как пользоваться калькулятором p-hat
- Введите общий размер выборки (n) — положительное целое число, обозначающее, сколько объектов, людей или наблюдений было отобрано.
- Введите число успехов (x) — неотрицательное целое число не больше n, обозначающее, сколько элементов выборки имеют интересующий признак.
- Нажмите Рассчитать. Инструмент вернет p̂ и q̂ как в десятичном виде, так и в процентах.
- Используйте p̂ как точечную оценку доли генеральной совокупности p. Помните, что одной p̂ недостаточно; для более полного вывода рассчитайте доверительный интервал.
- Нажмите Сбросить, чтобы очистить поля и начать новый расчет.
Часто задаваемые вопросы
Что означает p̂ в статистике?
p̂ (читается «p-hat») — это выборочная доля, то есть часть выборки, обладающая определенным признаком. Она используется для оценки неизвестной доли генеральной совокупности p. Символ шляпки (^) — стандартное статистическое обозначение оценки параметра совокупности, основанной на выборке.
Что такое q̂ и почему его сообщают?
q̂ = 1 − p̂ — это дополнение p̂, представляющее долю выборки, не имеющую данного признака. Его всегда сообщают вместе с p̂, потому что вместе они описывают полное бинарное разбиение выборки, а q̂ напрямую входит в формулу стандартной ошибки p̂: SE = √(p̂ × q̂ / n).
Насколько большим должно быть n, чтобы p̂ была надежной?
Распространенное практическое правило для использования нормальной аппроксимации долей требует, чтобы одновременно выполнялись np̂ ≥ 5 и nq̂ ≥ 5. Если эти условия не выполняются, для более точных доверительных интервалов используйте интервал Уилсона или точный интервал Клоппера — Пирсона вместо стандартной формулы нормальной аппроксимации.
Можно ли использовать p̂, если x или n не являются целыми числами?
В строгом определении p̂ — это счет, деленный на счет, поэтому оба значения должны быть неотрицательными целыми числами, причем x ≤ n. Однако в некоторых контекстах, например во взвешенных опросах или метаанализах с эффективными размерами выборки, возникают дробные входные значения. Этот калькулятор требует целые значения, чтобы сохранить математическую корректность.
Как p̂ используется в проверке гипотез?
Для одновыборочного теста H₀: p = p₀ тестовая статистика равна Z = (p̂ − p₀) / √(p₀(1 − p₀) / n). Если |Z| превышает критическое значение при выбранном уровне значимости, нулевая гипотеза отвергается. p-значение этого Z-показателя показывает вероятность наблюдать p̂ не менее экстремальную, чем полученная, если истинное p действительно равно p₀.
p̂ — это то же самое, что процент?
p̂ — десятичное число между 0 и 1; умножение на 100 дает эквивалентный процент. Они передают одну и ту же информацию: 0.55 и 55% — одно и то же значение, выраженное по-разному. Десятичные значения предпочтительны в формулах и расчетах доверительных интервалов; проценты удобнее при сообщении результатов широкой аудитории.