Калькулятор выборки - формула Кохрена

Рассчитайте минимальный размер выборки, необходимый для надежного опроса или исследования. Задайте уровень доверия, погрешность и долю населения, чтобы сразу получить результат.

Выберите уровень доверия, введите погрешность в процентах, задайте ожидаемую долю населения (если неизвестно, используйте 0.5) и при необходимости укажите общий размер населения для поправки на конечную совокупность.

Калькулятор выборки - формула Кохрена
Рассчитайте минимальный размер выборки, необходимый для надежного опроса или исследования. Задайте уровень доверия, погрешность и долю населения, чтобы сразу получить результат.

О калькуляторе размера выборки

Определение размера выборки — один из важнейших этапов при проектировании любого опроса, эксперимента или наблюдательного исследования. Правильное число участников обеспечивает статистическую значимость результатов и эффективное использование ресурсов. Этот калькулятор использует формулу Кохрена — отраслевой стандарт для оценки требуемого размера выборки, когда совокупность велика или неизвестна. Формула: n = Z² × p × (1 – p) / E², где Z — Z-значение, соответствующее желаемому уровню доверия, p — оцененная доля населения, а E — допустимая погрешность, выраженная десятичной дробью. Уровень доверия показывает, насколько вы хотите быть уверены, что результаты выборки попадут в указанный диапазон погрешности. Уровень доверия 95% — самый распространенный в социальных науках и маркетинговых исследованиях — соответствует Z-значению 1.96. Это означает, что если повторить опрос 100 раз, истинное значение совокупности окажется в пределах погрешности примерно в 95 из этих повторений. Погрешность определяет ширину диапазона неопределенности вокруг вашей оценки. Погрешность ±5% означает, что наблюдаемая доля может быть на 5 процентных пунктов выше или ниже истинной доли населения. Более строгие пределы погрешности требуют большей выборки. Поскольку в формуле есть E², при уменьшении погрешности вдвое необходимый размер выборки примерно возрастает в 4 раза. Доля p управляет дисперсией в формуле. При p = 0.5 значение p(1 – p) достигает максимума 0.25, и поэтому получается наиболее консервативная (то есть наибольшая) оценка размера выборки. Это стандартная рекомендация, когда предварительных данных нет. Если предыдущее исследование дало надежную оценку p, можно использовать ее и потенциально уменьшить требуемую выборку. Когда общий размер совокупности N мал по сравнению с требуемой выборкой (точнее, когда n превышает 5% от N), следует применять поправку на конечную совокупность (FPC): n_adj = n / (1 + (n – 1) / N). Эта корректировка уменьшает требуемый размер выборки, отражая тот факт, что измеряется большая доля населения. На практике стоит добавить запас к рассчитанной выборке, чтобы учесть неответы, проблемы качества данных и выбытие. Обычный подход — разделить целевой размер выборки на ожидаемую долю ответов. Например, если рассчитано n = 385, а ожидаемая доля ответов составляет 70%, следует связаться как минимум с 385 / 0.70 ≈ 550 потенциальными респондентами.

Примеры расчета размера выборки

Три распространенных сценария показывают, как уровень доверия, погрешность и размер совокупности влияют на требуемую выборку.

ПараметрыРазмер выборкиПримечания
95% доверия, ±5% погрешности, p=0.5, бесконечная совокупность385Классический ориентир по размеру выборки. Используется для общенациональных опросов и крупных исследований, где совокупность очень велика.
95% доверия, ±3% погрешности, p=0.5, бесконечная совокупность1,068Сужение погрешности с 5% до 3% более чем удваивает требуемую выборку из-за зависимости от E².
95% доверия, ±5% погрешности, p=0.5, N=500218Поправка на конечную совокупность уменьшает выборку с 385 до 218, потому что выборка составляет большую долю общей совокупности.

Как пользоваться калькулятором размера выборки

  1. Выберите нужный уровень доверия в выпадающем списке (80%, 85%, 90%, 95% или 99%). Для большинства опросов стандартом является 95%.
  2. Введите погрешность в процентах. Значение 5 означает ±5%. Меньшие значения дают более высокую точность, но требуют большей выборки.
  3. Введите ожидаемую долю населения в виде десятичной дроби от 0 до 1. Если не уверены, используйте 0.5 — это даст наибольшую (самую консервативную) оценку.
  4. При необходимости укажите общий размер населения, если совокупность мала и конечна. Если население большое или неизвестно, оставьте поле пустым.
  5. Нажмите «Рассчитать», чтобы увидеть рекомендуемый минимальный размер выборки. Нажмите «Сбросить», чтобы очистить все поля и начать заново.

Часто задаваемые вопросы о калькуляторе выборки

Почему при неопределенности рекомендуется доля 0.5?
Выражение p(1 – p) достигает максимума 0.25, когда p = 0.5. Использование 0.5 гарантирует, что формула даст максимально возможный размер выборки для заданных уровня доверия и погрешности, обеспечивая консервативную оценку, достаточную независимо от истинной доли.
Что означает уровень доверия 95%?
Уровень доверия 95% означает, что если повторять процесс отбора проб многократно, 95% полученных доверительных интервалов будут содержать истинный параметр совокупности. Это не означает, что существует 95% вероятность того, что истинное значение находится в конкретном уже рассчитанном интервале.
Как размер совокупности влияет на требуемую выборку?
Для больших совокупностей требуемый размер выборки практически не зависит от размера населения — опрос 385 человек статистически столь же значим для страны с населением 300 миллионов, как и для города с 100 тысячами жителей. Поправка на конечную совокупность дает заметную разницу только тогда, когда требуемая выборка превышает 5% от общей совокупности.
Какова связь между погрешностью и размером выборки?
Погрешность входит в формулу Кохрена как E² в знаменателе, поэтому связь обратно-квадратичная: при уменьшении погрешности вдвое требуется примерно в 4 раза больше респондентов. Именно поэтому очень высокая точность (например, ±1%) обходится чрезвычайно дорого по размеру выборки.
Нужно ли добавлять запас на неответы?
Да. Расчетный размер выборки — это число завершенных, пригодных ответов. Чтобы учесть неответы, разделите это число на ожидаемую долю ответов. Если вы ожидаете 60% ответов и вам нужно 385 завершенных анкет, следует связаться как минимум с 385 / 0.60 ≈ 642 потенциальными респондентами.
Можно ли использовать этот калькулятор для A/B-тестов?
Реализованная здесь формула Кохрена предназначена для оценки долей в социологических опросах. Для A/B-тестов также нужно задать минимально обнаруживаемый эффект и статистическую мощность (обычно 80%). Специализированные калькуляторы размера выборки для A/B-тестов используют немного другие формулы и лучше подходят для этой задачи.