Калькулятор доверительного интервала - среднее и доля

Рассчитайте доверительные интервалы для генерального среднего по выборочным статистикам или сырым данным

Введите выборочное среднее, стандартное отклонение и размер выборки — или предоставьте сырые данные — чтобы вычислить доверительные интервалы на уровнях 90%, 95% или 99%.

Калькулятор доверительного интервала - среднее и доля
Рассчитайте доверительные интервалы для генерального среднего по выборочным статистикам или сырым данным

О калькуляторе доверительного интервала

Доверительный интервал (CI) — это диапазон значений, который с заданным уровнем доверия, вероятно, содержит истинный параметр генеральной совокупности — чаще всего генеральное среднее. Доверительные интервалы являются одним из самых используемых инструментов в выводной статистике, позволяя количественно оценивать неопределённость оценок и наглядно показывать точность. Формула доверительного интервала для генерального среднего (когда стандартное отклонение генеральной совокупности неизвестно и объём выборки достаточно велик) имеет вид: CI = x̄ ± z* × (s / √n), где x̄ — выборочное среднее, s — выборочное стандартное отклонение, n — размер выборки, а z* — критическое значение стандартного нормального распределения, соответствующее выбранному уровню доверия. Для 95% CI z* = 1.96; для 90% — около 1.645; для 99% — около 2.576. Величина s / √n называется стандартной ошибкой среднего (SE). Она показывает, насколько выборочное среднее может изменяться от выборки к выборке. Больший размер выборки уменьшает SE, делая интервал уже и точнее. Погрешность (MOE) равна z* × SE; нижняя граница CI — x̄ − MOE, верхняя — x̄ + MOE. Важно правильно интерпретировать доверительный интервал. 95% CI НЕ означает, что существует 95% вероятность того, что истинное среднее находится именно в этом конкретном интервале. Скорее это означает, что если многократно повторять процедуру выборки и каждый раз вычислять CI, примерно 95% таких интервалов будут содержать истинное среднее. Доверие относится к процедуре, а не к одному интервалу. Доверительные интервалы используются в клинических исследованиях для отчёта об эффектах лечения, в опросах — для указания погрешности, в контроле качества — для отслеживания средних значений процесса и в любых научных исследованиях, где нужна оценка по выборке. Этот калькулятор использует z-распределение (нормальную аппроксимацию), которое подходит для больших выборок (n ≥ 30) или когда распределение в генеральной совокупности примерно нормально. Для небольших выборок из неизвестных распределений более уместен интервал на основе t-распределения.

Примеры

В таблице ниже показаны расчёты доверительных интервалов для типичных статистических сценариев.

Входные данные95% CIКонтекст
x̄=75, s=5, n=100, 95% CI(74.02, 75.98)Баллы студентов — большая выборка
x̄=250, s=10, n=50, 99% CI(246.36, 253.64)Вес продукта в граммах — высокая уверенность
data: 22,25,21,24,23,26,20, 90% CI(21.66, 24.34)Дневные температуры — небольшой набор сырых данных
x̄=35, s=8, n=200, 95% CI(33.89, 36.11)Среднее время доставки в минутах

Как пользоваться калькулятором доверительного интервала

  1. Выберите «Сводные статистики», если у вас уже есть выборочное среднее, стандартное отклонение и размер выборки; или выберите «Сырые данные» для ввода отдельных значений.
  2. Выберите уровень доверия: 90% (z=1.645), 95% (z=1.96) или 99% (z=2.576). Более высокий уровень доверия даёт более широкий интервал.
  3. Для сводных статистик введите выборочное среднее (x̄), выборочное стандартное отклонение (s ≥ 0) и размер выборки (n ≥ 2). Для сырых данных введите числа, разделённые запятыми или пробелами.
  4. Нажмите «Вычислить», чтобы увидеть границы доверительного интервала, погрешность и стандартную ошибку.
  5. Интерпретация результата: интервал (нижняя, верхняя граница) — это диапазон, который при повторной выборке с выбранным уровнем доверия содержит истинное генеральное среднее.

Часто задаваемые вопросы

Что означает 95% доверительный интервал?
95% CI означает, что если вы многократно повторите одну и ту же процедуру выборки и каждый раз вычислите доверительный интервал, примерно 95% таких интервалов будут содержать истинное среднее генеральной совокупности. Это не означает, что существует 95% вероятность того, что истинное среднее находится именно в этом конкретном интервале — после вычисления интервал либо содержит истинное среднее, либо нет.
Что такое погрешность?
Погрешность (MOE) — это половина ширины доверительного интервала: MOE = z* × (s / √n). Она показывает максимально ожидаемую разницу между выборочным средним и истинным генеральным средним при выбранном уровне доверия. Чтобы уменьшить MOE, нужно увеличить размер выборки, уменьшить стандартное отклонение (меньше разброс данных) или выбрать более низкий уровень доверия.
Когда использовать z-распределение, а когда t-распределение?
Используйте z-распределение (как в этом калькуляторе), когда размер выборки большой (n ≥ 30) или известно стандартное отклонение генеральной совокупности. Используйте t-распределение, когда n < 30 и стандартное отклонение неизвестно, потому что у t-распределения более тяжёлые хвосты и оно учитывает дополнительную неопределённость при оценке стандартного отклонения по небольшой выборке.
Как размер выборки влияет на доверительный интервал?
Увеличение размера выборки n уменьшает стандартную ошибку (s / √n), а значит сужает доверительный интервал. Например, удвоение размера выборки уменьшает погрешность в √2 ≈ 1.41 раза. Поэтому опросы с большими выборками (например, n=1000) имеют небольшую погрешность (~3% при 95%), а пилотные исследования с n=20 могут давать очень широкие интервалы.
Что делать, если данные не распределены нормально?
Центральная предельная теорема гарантирует, что по мере роста n распределение выборочных средних приближается к нормальному независимо от распределения в генеральной совокупности. Для n ≥ 30 z-интервал обычно надёжен. Для небольших выборок с сильно асимметричными или тяжёлохвостыми распределениями рассмотрите бутстрэп-интервалы или t-интервалы — оба варианта более устойчивы.
Можно ли вычислить доверительный интервал для доли?
Да, но формула другая. Для выборочной доли p̂ при n испытаниях интервал Уолда имеет вид p̂ ± z* × √(p̂(1−p̂)/n). Этот калькулятор предназначен для среднего. Для долей — например, для оценки доли избирателей, поддерживающих кандидата, — используйте отдельный инструмент для доверительных интервалов долей. Для малых выборок или долей, близких к 0 или 1, обычно предпочтительнее интервал Уилсона, а не формула Уолда.