Калькулятор доверительного интервала - среднее и доля
Рассчитайте доверительные интервалы для генерального среднего по выборочным статистикам или сырым данным
Введите выборочное среднее, стандартное отклонение и размер выборки — или предоставьте сырые данные — чтобы вычислить доверительные интервалы на уровнях 90%, 95% или 99%.
Калькулятор доверительного интервала - среднее и доля
Рассчитайте доверительные интервалы для генерального среднего по выборочным статистикам или сырым данным
О калькуляторе доверительного интервала
Доверительный интервал (CI) — это диапазон значений, который с заданным уровнем доверия, вероятно, содержит истинный параметр генеральной совокупности — чаще всего генеральное среднее. Доверительные интервалы являются одним из самых используемых инструментов в выводной статистике, позволяя количественно оценивать неопределённость оценок и наглядно показывать точность.
Формула доверительного интервала для генерального среднего (когда стандартное отклонение генеральной совокупности неизвестно и объём выборки достаточно велик) имеет вид: CI = x̄ ± z* × (s / √n), где x̄ — выборочное среднее, s — выборочное стандартное отклонение, n — размер выборки, а z* — критическое значение стандартного нормального распределения, соответствующее выбранному уровню доверия. Для 95% CI z* = 1.96; для 90% — около 1.645; для 99% — около 2.576.
Величина s / √n называется стандартной ошибкой среднего (SE). Она показывает, насколько выборочное среднее может изменяться от выборки к выборке. Больший размер выборки уменьшает SE, делая интервал уже и точнее. Погрешность (MOE) равна z* × SE; нижняя граница CI — x̄ − MOE, верхняя — x̄ + MOE.
Важно правильно интерпретировать доверительный интервал. 95% CI НЕ означает, что существует 95% вероятность того, что истинное среднее находится именно в этом конкретном интервале. Скорее это означает, что если многократно повторять процедуру выборки и каждый раз вычислять CI, примерно 95% таких интервалов будут содержать истинное среднее. Доверие относится к процедуре, а не к одному интервалу.
Доверительные интервалы используются в клинических исследованиях для отчёта об эффектах лечения, в опросах — для указания погрешности, в контроле качества — для отслеживания средних значений процесса и в любых научных исследованиях, где нужна оценка по выборке. Этот калькулятор использует z-распределение (нормальную аппроксимацию), которое подходит для больших выборок (n ≥ 30) или когда распределение в генеральной совокупности примерно нормально. Для небольших выборок из неизвестных распределений более уместен интервал на основе t-распределения.
Примеры
В таблице ниже показаны расчёты доверительных интервалов для типичных статистических сценариев.
| Входные данные | 95% CI | Контекст |
|---|---|---|
| x̄=75, s=5, n=100, 95% CI | (74.02, 75.98) | Баллы студентов — большая выборка |
| x̄=250, s=10, n=50, 99% CI | (246.36, 253.64) | Вес продукта в граммах — высокая уверенность |
| data: 22,25,21,24,23,26,20, 90% CI | (21.66, 24.34) | Дневные температуры — небольшой набор сырых данных |
| x̄=35, s=8, n=200, 95% CI | (33.89, 36.11) | Среднее время доставки в минутах |
Как пользоваться калькулятором доверительного интервала
- Выберите «Сводные статистики», если у вас уже есть выборочное среднее, стандартное отклонение и размер выборки; или выберите «Сырые данные» для ввода отдельных значений.
- Выберите уровень доверия: 90% (z=1.645), 95% (z=1.96) или 99% (z=2.576). Более высокий уровень доверия даёт более широкий интервал.
- Для сводных статистик введите выборочное среднее (x̄), выборочное стандартное отклонение (s ≥ 0) и размер выборки (n ≥ 2). Для сырых данных введите числа, разделённые запятыми или пробелами.
- Нажмите «Вычислить», чтобы увидеть границы доверительного интервала, погрешность и стандартную ошибку.
- Интерпретация результата: интервал (нижняя, верхняя граница) — это диапазон, который при повторной выборке с выбранным уровнем доверия содержит истинное генеральное среднее.
Часто задаваемые вопросы
Что означает 95% доверительный интервал?
95% CI означает, что если вы многократно повторите одну и ту же процедуру выборки и каждый раз вычислите доверительный интервал, примерно 95% таких интервалов будут содержать истинное среднее генеральной совокупности. Это не означает, что существует 95% вероятность того, что истинное среднее находится именно в этом конкретном интервале — после вычисления интервал либо содержит истинное среднее, либо нет.
Что такое погрешность?
Погрешность (MOE) — это половина ширины доверительного интервала: MOE = z* × (s / √n). Она показывает максимально ожидаемую разницу между выборочным средним и истинным генеральным средним при выбранном уровне доверия. Чтобы уменьшить MOE, нужно увеличить размер выборки, уменьшить стандартное отклонение (меньше разброс данных) или выбрать более низкий уровень доверия.
Когда использовать z-распределение, а когда t-распределение?
Используйте z-распределение (как в этом калькуляторе), когда размер выборки большой (n ≥ 30) или известно стандартное отклонение генеральной совокупности. Используйте t-распределение, когда n < 30 и стандартное отклонение неизвестно, потому что у t-распределения более тяжёлые хвосты и оно учитывает дополнительную неопределённость при оценке стандартного отклонения по небольшой выборке.
Как размер выборки влияет на доверительный интервал?
Увеличение размера выборки n уменьшает стандартную ошибку (s / √n), а значит сужает доверительный интервал. Например, удвоение размера выборки уменьшает погрешность в √2 ≈ 1.41 раза. Поэтому опросы с большими выборками (например, n=1000) имеют небольшую погрешность (~3% при 95%), а пилотные исследования с n=20 могут давать очень широкие интервалы.
Что делать, если данные не распределены нормально?
Центральная предельная теорема гарантирует, что по мере роста n распределение выборочных средних приближается к нормальному независимо от распределения в генеральной совокупности. Для n ≥ 30 z-интервал обычно надёжен. Для небольших выборок с сильно асимметричными или тяжёлохвостыми распределениями рассмотрите бутстрэп-интервалы или t-интервалы — оба варианта более устойчивы.
Можно ли вычислить доверительный интервал для доли?
Да, но формула другая. Для выборочной доли p̂ при n испытаниях интервал Уолда имеет вид p̂ ± z* × √(p̂(1−p̂)/n). Этот калькулятор предназначен для среднего. Для долей — например, для оценки доли избирателей, поддерживающих кандидата, — используйте отдельный инструмент для доверительных интервалов долей. Для малых выборок или долей, близких к 0 или 1, обычно предпочтительнее интервал Уилсона, а не формула Уолда.