Q: Как размер выборки влияет на доверительный интервал?

Увеличение размера выборки n уменьшает стандартную ошибку (s / √n), а значит сужает доверительный интервал. Например, удвоение размера выборки уменьшает погрешность в √2 ≈ 1.41 раза. Поэтому опросы с большими выборками (например, n=1000) имеют небольшую погрешность (~3% при 95%), а пилотные исследования с n=20 могут давать очень широкие интервалы.

Q: Что делать, если данные не распределены нормально?

Центральная предельная теорема гарантирует, что по мере роста n распределение выборочных средних приближается к нормальному независимо от распределения в генеральной совокупности. Для n ≥ 30 z-интервал обычно надёжен. Для небольших выборок с сильно асимметричными или тяжёлохвостыми распределениями рассмотрите бутстрэп-интервалы или t-интервалы — оба варианта более устойчивы.

Q: Можно ли вычислить доверительный интервал для доли?

Да, но формула другая. Для выборочной доли p̂ при n испытаниях интервал Уолда имеет вид p̂ ± z* × √(p̂(1−p̂)/n). Этот калькулятор предназначен для среднего. Для долей — например, для оценки доли избирателей, поддерживающих кандидата, — используйте отдельный инструмент для доверительных интервалов долей. Для малых выборок или долей, близких к 0 или 1, обычно предпочтительнее интервал Уилсона, а не формула Уолда.

Question 1

Что означает 95% доверительный интервал?

Accepted Answer

95% CI означает, что если вы многократно повторите одну и ту же процедуру выборки и каждый раз вычислите доверительный интервал, примерно 95% таких интервалов будут содержать истинное среднее генеральной совокупности. Это не означает, что существует 95% вероятность того, что истинное среднее находится именно в этом конкретном интервале — после вычисления интервал либо содержит истинное среднее, либо нет.

Question 2

Что такое погрешность?

Accepted Answer

Погрешность (MOE) — это половина ширины доверительного интервала: MOE = z* × (s / √n). Она показывает максимально ожидаемую разницу между выборочным средним и истинным генеральным средним при выбранном уровне доверия. Чтобы уменьшить MOE, нужно увеличить размер выборки, уменьшить стандартное отклонение (меньше разброс данных) или выбрать более низкий уровень доверия.

Question 3

Когда использовать z-распределение, а когда t-распределение?

Accepted Answer

Используйте z-распределение (как в этом калькуляторе), когда размер выборки большой (n ≥ 30) или известно стандартное отклонение генеральной совокупности. Используйте t-распределение, когда n < 30 и стандартное отклонение неизвестно, потому что у t-распределения более тяжёлые хвосты и оно учитывает дополнительную неопределённость при оценке стандартного отклонения по небольшой выборке.

Question 4

Как размер выборки влияет на доверительный интервал?

Accepted Answer

Увеличение размера выборки n уменьшает стандартную ошибку (s / √n), а значит сужает доверительный интервал. Например, удвоение размера выборки уменьшает погрешность в √2 ≈ 1.41 раза. Поэтому опросы с большими выборками (например, n=1000) имеют небольшую погрешность (~3% при 95%), а пилотные исследования с n=20 могут давать очень широкие интервалы.

Question 5

Что делать, если данные не распределены нормально?

Accepted Answer

Центральная предельная теорема гарантирует, что по мере роста n распределение выборочных средних приближается к нормальному независимо от распределения в генеральной совокупности. Для n ≥ 30 z-интервал обычно надёжен. Для небольших выборок с сильно асимметричными или тяжёлохвостыми распределениями рассмотрите бутстрэп-интервалы или t-интервалы — оба варианта более устойчивы.

Question 6

Можно ли вычислить доверительный интервал для доли?

Accepted Answer

Да, но формула другая. Для выборочной доли p̂ при n испытаниях интервал Уолда имеет вид p̂ ± z* × √(p̂(1−p̂)/n). Этот калькулятор предназначен для среднего. Для долей — например, для оценки доли избирателей, поддерживающих кандидата, — используйте отдельный инструмент для доверительных интервалов долей. Для малых выборок или долей, близких к 0 или 1, обычно предпочтительнее интервал Уилсона, а не формула Уолда.

Входные данные	95% CI	Контекст
x̄=75, s=5, n=100, 95% CI	(74.02, 75.98)	Баллы студентов — большая выборка
x̄=250, s=10, n=50, 99% CI	(246.36, 253.64)	Вес продукта в граммах — высокая уверенность
data: 22,25,21,24,23,26,20, 90% CI	(21.66, 24.34)	Дневные температуры — небольшой набор сырых данных
x̄=35, s=8, n=200, 95% CI	(33.89, 36.11)	Среднее время доставки в минутах

Калькулятор доверительного интервала - среднее и доля

О калькуляторе доверительного интервала

Примеры

Как пользоваться калькулятором доверительного интервала

Часто задаваемые вопросы