Калькулятор объединенного стандартного отклонения
Расчет объединенного стандартного отклонения для двух независимых выборок
Введите размеры выборок, средние значения и стандартные отклонения двух групп, чтобы вычислить объединенное стандартное отклонение, t-статистику и d Коэна.
Калькулятор объединенного стандартного отклонения
Расчет объединенного стандартного отклонения для двух независимых выборок
Выборка 1
Выборка 2
О калькуляторе объединенного стандартного отклонения
Объединенное стандартное отклонение — это взвешенное среднее стандартных отклонений двух (или более) независимых выборок, используемое при сравнении групп с одинаковой базовой дисперсией генеральной совокупности. Это один из ключевых элементов t-критерия для независимых выборок и многих других процедур статистического вывода.
Формула объединенного стандартного отклонения: sp = √[((n₁−1)s₁² + (n₂−1)s₂²) / (n₁+n₂−2)], где n₁ и n₂ — размеры выборок, а s₁ и s₂ — выборочные стандартные отклонения. Знаменатель n₁+n₂−2 представляет общее число степеней свободы для сравнения двух выборок.
Объединенное стандартное отклонение предполагает однородность дисперсий — то есть обе выборки происходят из совокупностей с одинаковой дисперсией. Это предположение следует проверить (например, с помощью теста Левена или теста Бартлетта) перед использованием объединенной оценки. Если дисперсии не равны, предпочтителен t-критерий Уэлча, поскольку он не объединяет дисперсии.
Помимо объединенного SD, этот калькулятор предоставляет объединенную дисперсию (sp²), общее число степеней свободы, t-статистику для двух выборок и d Коэна как стандартизированный размер эффекта. Cohen's d = (mean₁ − mean₂) / sp количественно выражает практическую значимость разницы средних в единицах объединенного стандартного отклонения.
Ориентиры для d Коэна: значения около 0.2 считаются малым эффектом, 0.5 — средним, а 0.8 и выше — большим. Эти пороги помогают интерпретировать результаты в психологии, медицине, образовании и социальных науках.
Объединенное стандартное отклонение также используется при расчете доверительных интервалов для разности двух средних, в метаанализе для объединения размеров эффекта между исследованиями и в контроле качества при агрегировании оценок вариабельности по производственным партиям.
Практические применения включают клинические испытания (сравнение группы лечения и контрольной группы), A/B-тестирование в продуктовой аналитике (сравнение коэффициентов конверсии), образовательные исследования (сравнение вариабельности результатов тестов между классами) и промышленный контроль качества (объединение оценок доли дефектов по нескольким производственным линиям).
Помните: объединенное стандартное отклонение является более точной оценкой общего стандартного отклонения генеральной совокупности, чем стандартное отклонение любой отдельной выборки, поскольку одновременно использует информацию из обеих групп.
Примеры
Эти примеры показывают, как рассчитывается объединенное стандартное отклонение в разных сценариях с двумя выборками.
| Входные данные | Объединенное SD | Контекст |
|---|---|---|
| n₁=10, x̄₁=50, s₁=2; n₂=15, x̄₂=55, s₂=3 | sp ≈ 2.669 | Неравные размеры выборок, разные средние |
| n₁=20, x̄₁=30, s₁=4; n₂=20, x̄₂=35, s₂=4 | sp = 4.000 | Равные размеры и SD, обычное среднее |
| n₁=30, x̄₁=100, s₁=10; n₂=30, x̄₂=105, s₂=12 | sp ≈ 11.045 | Более крупные выборки, похожие SD |
| n₁=5, x̄₁=8, s₁=1.5; n₂=8, x̄₂=10, s₂=2 | sp ≈ 1.824 | Малые выборки, больший вес у более крупной группы |
Как пользоваться этим калькулятором
- Введите размер выборки (n₁), среднее (x̄₁) и стандартное отклонение (s₁) для первой группы.
- Введите соответствующие значения (n₂, x̄₂, s₂) для второй группы. Размеры выборок должны быть не менее 2.
- Нажмите «Рассчитать», чтобы вычислить объединенное стандартное отклонение, объединенную дисперсию, степени свободы, t-статистику и d Коэна.
- Интерпретируйте объединенное SD как лучшую оценку общего стандартного отклонения генеральной совокупности при предположении равенства дисперсий.
- Используйте t-статистику и степени свободы с таблицей t-распределения, чтобы определить статистическую значимость, или проверьте d Коэна для оценки размера эффекта.
Часто задаваемые вопросы
Что такое объединенное стандартное отклонение?
Объединенное стандартное отклонение (sp) объединяет оценки дисперсии из двух независимых выборок в одну более точную оценку. Это взвешенное среднее двух выборочных дисперсий, взвешенное по их степеням свободы. Оно предполагает, что обе совокупности имеют одну и ту же базовую дисперсию.
Когда следует использовать объединенное стандартное отклонение?
Используйте объединенное стандартное отклонение, когда предполагаете однородность дисперсий между двумя группами, например в классическом t-критерии для двух выборок. Если предварительный тест (Левена, Бартлетта) указывает, что дисперсии существенно различаются, используйте t-критерий Уэлча, который не требует равенства дисперсий.
Что такое d Коэна и как его интерпретировать?
d Коэна — это стандартизированный размер эффекта, выражающий разницу средних в единицах объединенного стандартного отклонения. Значения примерно 0.2, 0.5 и 0.8 обычно описываются как малый, средний и большой эффекты соответственно. Большое d Коэна означает, что две группы хорошо разделены относительно их объединенной вариабельности.
Почему формула делит на n₁+n₂−2?
Знаменатель n₁+n₂−2 представляет общее число степеней свободы, израсходованных на оценку двух выборочных средних. Использование степеней свободы (а не n₁+n₂) дает несмещенную оценку дисперсии генеральной совокупности. Каждая выборка вносит nᵢ−1 степеней свободы в объединенную оценку.
Можно ли использовать объединенное стандартное отклонение для более чем двух групп?
Да. Объединенное стандартное отклонение можно расширить на k групп по формуле sp = √[Σ(nᵢ−1)sᵢ² / Σ(nᵢ−1)]. Это обобщение используется в ANOVA, где единое объединенное внутригрупповое стандартное отклонение (корень из средней квадратичной ошибки) служит оценкой общей дисперсии.
Как размер выборки влияет на объединенное стандартное отклонение?
Более крупные выборки имеют больший вес в объединенной оценке. Если n₁ >> n₂, объединенное SD в основном определяется дисперсией первой выборки. Это отражает принцип, что больший объем данных дает более надежную оценку дисперсии. Это также означает, что выбросы или нарушения предположения о равенстве дисперсий оказывают большее влияние, когда одна выборка намного больше.