Калькулятор размера выборки - формула Кокрана
Рассчитайте минимальный размер выборки для надёжного опроса или исследования. Укажите уровень доверия, погрешность и долю населения, чтобы мгновенно получить результат.
Выберите уровень доверия, введите погрешность в процентах, задайте ожидаемую долю населения (используйте 0.5, если она неизвестна) и при необходимости укажите общий размер населения для поправки на конечную совокупность.
Калькулятор размера выборки - формула Кокрана
Рассчитайте минимальный размер выборки для надёжного опроса или исследования. Укажите уровень доверия, погрешность и долю населения, чтобы мгновенно получить результат.
О калькуляторе размера выборки
Определение размера выборки — один из самых важных этапов при проектировании любого опроса, эксперимента или наблюдательного исследования. Правильное число участников обеспечивает статистическую значимость результатов и эффективное использование ресурсов.
Этот калькулятор использует формулу Кокрана — общепринятый отраслевой подход для оценки требуемого размера выборки, когда совокупность велика или неизвестна. Формула: n = Z² × p × (1 – p) / E², где Z — Z-оценка, соответствующая желаемому уровню доверия, p — оценённая доля населения, а E — допустимая погрешность, выраженная в виде десятичной дроби.
Уровень доверия показывает, насколько вы хотите быть уверены, что результаты выборки попадут в заданную погрешность. Уровень доверия 95% — самый распространённый в социальных науках и маркетинговых исследованиях — соответствует Z-оценке 1.96. Это означает, что если повторить опрос 100 раз, истинное значение совокупности окажется в пределах вашей погрешности примерно в 95 из этих повторений.
Погрешность определяет ширину зоны неопределённости вокруг оценки. Погрешность ±5% означает, что наблюдаемая доля может быть на 5 процентных пунктов выше или ниже истинной доли населения. Более узкая погрешность требует большего размера выборки. Поскольку в формуле присутствует E², при уменьшении погрешности вдвое необходимый размер выборки примерно возрастает в четыре раза.
Доля p определяет дисперсию в формуле. При p = 0.5 выражение p(1 – p) достигает максимума 0.25, поэтому получается наиболее консервативная (то есть наибольшая) оценка размера выборки. Это стандартная рекомендация, когда исходной информации нет. Если у вас есть надёжная оценка p из предыдущего исследования, можно использовать её и потенциально уменьшить требуемый размер выборки.
Когда общий размер совокупности N мал по сравнению с требуемой выборкой (точнее, когда n превышает 5% от N), следует применять поправку на конечную совокупность (FPC): n_adj = n / (1 + (n – 1) / N). Эта корректировка уменьшает требуемый размер выборки, отражая тот факт, что измеряется большая доля совокупности.
На практике стоит добавить запас на неответы, проблемы с качеством данных и отказы. Обычно целевой размер выборки делят на ожидаемую долю ответов. Например, если вы рассчитали n = 385, но ожидаете уровень ответов 70%, вам следует связаться как минимум с 385 / 0.70 ≈ 550 потенциальными респондентами.
Примеры расчёта размера выборки
Три типичных сценария показывают, как уровень доверия, погрешность и размер совокупности влияют на требуемую выборку.
| Параметры | Размер выборки | Примечания |
|---|---|---|
| 95% CL, ±5% MoE, p=0.5, infinite population | 385 | Классический ориентир размера выборки. Используется для общенациональных опросов и крупных исследований при очень большой совокупности. |
| 95% CL, ±3% MoE, p=0.5, infinite population | 1,068 | Сужение погрешности с 5% до 3% более чем удваивает требуемый размер выборки из-за зависимости от E². |
| 95% CL, ±5% MoE, p=0.5, N=500 | 218 | Поправка на конечную совокупность уменьшает выборку с 385 до 218, поскольку выборка составляет большую долю всей совокупности. |
Как пользоваться калькулятором размера выборки
- Выберите нужный уровень доверия в выпадающем списке (80%, 85%, 90%, 95% или 99%). Для большинства опросов стандартом является 95%.
- Введите погрешность в процентах. Значение 5 означает ±5%. Меньшие значения дают более высокую точность, но требуют большего размера выборки.
- Введите ожидаемую долю населения в виде десятичной дроби от 0 до 1. Если не уверены, используйте 0.5 — это даст наибольшую и наиболее консервативную оценку размера выборки.
- При необходимости укажите общий размер населения, если ваша совокупность мала и конечна. Если совокупность большая или неизвестна, оставьте поле пустым.
- Нажмите «Рассчитать», чтобы увидеть рекомендуемый минимальный размер выборки. Нажмите «Сбросить», чтобы очистить все поля и начать заново.
Часто задаваемые вопросы о калькуляторе размера выборки
Почему при неопределённости рекомендуется 0.5?
Выражение p(1 – p) достигает максимума 0.25 при p = 0.5. Использование 0.5 гарантирует, что формула даст максимально возможный размер выборки при заданных уровне доверия и погрешности, обеспечивая консервативную оценку, достаточную независимо от истинной доли.
Что означает уровень доверия 95%?
Уровень доверия 95% означает, что если многократно повторять процедуру выборки, 95% полученных доверительных интервалов будут содержать истинный параметр совокупности. Это не означает, что существует 95% вероятность того, что истинное значение находится в конкретном рассчитанном интервале.
Как размер совокупности влияет на требуемую выборку?
Для больших совокупностей требуемый размер выборки практически не зависит от размера населения — опрос 385 человек статистически столь же значим для страны с населением 300 миллионов, как и для города с 100 000 жителей. Поправка на конечную совокупность имеет значение только тогда, когда требуемая выборка превышает 5% от всей совокупности.
Какова связь между погрешностью и размером выборки?
Погрешность входит в формулу Кокрана как E² в знаменателе, поэтому связь обратно-квадратичная: при уменьшении погрешности вдвое требуется примерно в четыре раза больше респондентов. Поэтому добиться очень высокой точности (например, ±1%) чрезвычайно дорого с точки зрения размера выборки.
Нужно ли добавлять респондентов на случай неответов?
Да. Рассчитанный размер выборки — это количество завершённых и пригодных ответов. Чтобы учесть неответы, разделите это число на ожидаемую долю ответов. Если вы ожидаете уровень ответов 60% и вам нужны 385 завершённых анкет, следует связаться как минимум с 385 / 0.60 ≈ 642 потенциальными респондентами.
Можно ли использовать этот калькулятор для A/B-тестов?
Формула Кокрана, реализованная здесь, предназначена для оценки долей в опросных исследованиях. Для A/B-тестов также нужно задать минимально обнаруживаемый эффект и статистическую мощность (обычно 80%). Специальные калькуляторы размера выборки для A/B-тестов используют немного другие формулы и лучше подходят для этого случая.