Калькулятор объединенного стандартного отклонения
Расчет объединенного стандартного отклонения для двух независимых выборок
Введите размеры выборок, средние и стандартные отклонения для двух групп, чтобы вычислить объединенное стандартное отклонение, t-статистику и d Коэна.
Калькулятор объединенного стандартного отклонения
Расчет объединенного стандартного отклонения для двух независимых выборок
Выборка 1
Выборка 2
О калькуляторе объединенного стандартного отклонения
Объединенное стандартное отклонение — это взвешенное среднее стандартных отклонений двух (или более) независимых выборок, применяемое при сравнении групп, которые имеют одну и ту же базовую дисперсию генеральной совокупности. Это ключевой элемент t-критерия для независимых выборок и многих других процедур выводной статистики.
Формула объединенного стандартного отклонения: sp = √[((n₁−1)s₁² + (n₂−1)s₂²) / (n₁+n₂−2)], где n₁ и n₂ — размеры выборок, а s₁ и s₂ — выборочные стандартные отклонения. Знаменатель n₁+n₂−2 представляет общее число степеней свободы для сравнения двух выборок.
Объединенное стандартное отклонение предполагает однородность дисперсий, то есть что обе выборки происходят из совокупностей с одинаковой дисперсией. Это предположение следует проверить (например, с помощью теста Левена или теста Бартлетта) перед использованием объединенной оценки. Если дисперсии не равны, предпочтителен t-критерий Уэлча, поскольку он не объединяет дисперсии.
Помимо объединенного СО, этот калькулятор показывает объединенную дисперсию (sp²), общее число степеней свободы, t-статистику для двух выборок и d Коэна как стандартизированный размер эффекта. d Коэна = (mean₁ − mean₂) / sp количественно выражает практическую значимость разницы средних в единицах объединенного стандартного отклонения.
Ориентиры для d Коэна: значения около 0.2 считаются малыми эффектами, 0.5 — средними, а 0.8 и выше — большими. Эти пороги помогают интерпретировать результаты в психологии, медицине, образовании и социальных науках.
Объединенное стандартное отклонение также используется при расчете доверительных интервалов для разности двух средних, в метаанализе для объединения размеров эффекта между исследованиями и в контроле качества при агрегировании оценок изменчивости по производственным партиям.
Практические применения включают клинические испытания (сравнение лечебной и контрольной групп), A/B-тестирование в продуктовой аналитике (сравнение коэффициентов конверсии), образовательные исследования (сравнение вариативности результатов тестов между классами) и промышленный контроль качества (объединение оценок доли дефектов на нескольких производственных линиях).
Важно помнить: объединенное стандартное отклонение дает более точную оценку общего стандартного отклонения генеральной совокупности, чем любое отдельное выборочное стандартное отклонение, потому что одновременно использует информацию из обеих групп.
Примеры
Эти примеры показывают, как вычисляется объединенное стандартное отклонение в разных сценариях с двумя выборками.
| Входные данные | Объединенное СО | Контекст |
|---|---|---|
| n₁=10, x̄₁=50, s₁=2; n₂=15, x̄₂=55, s₂=3 | sp ≈ 2.669 | Неравные размеры выборок, разные средние |
| n₁=20, x̄₁=30, s₁=4; n₂=20, x̄₂=35, s₂=4 | sp = 4.000 | Равные размеры и СО, простое усреднение |
| n₁=30, x̄₁=100, s₁=10; n₂=30, x̄₂=105, s₂=12 | sp ≈ 11.045 | Большие выборки, похожие СО |
| n₁=5, x̄₁=8, s₁=1.5; n₂=8, x̄₂=10, s₂=2 | sp ≈ 1.824 | Малые выборки, больший вес у более крупной группы |
Как пользоваться этим калькулятором
- Введите размер выборки (n₁), среднее (x̄₁) и стандартное отклонение (s₁) для первой группы.
- Введите соответствующие значения (n₂, x̄₂, s₂) для второй группы. Размеры выборок должны быть не меньше 2.
- Нажмите «Рассчитать», чтобы получить объединенное стандартное отклонение, объединенную дисперсию, степени свободы, t-статистику и d Коэна.
- Интерпретируйте объединенное СО как лучшую оценку общего стандартного отклонения генеральной совокупности при предположении равенства дисперсий.
- Используйте t-статистику и степени свободы вместе с таблицей t-распределения, чтобы определить статистическую значимость, или смотрите d Коэна для оценки размера эффекта.
Часто задаваемые вопросы
Что такое объединенное стандартное отклонение?
Объединенное стандартное отклонение (sp) объединяет оценки дисперсии двух независимых выборок в одну более точную оценку. Это взвешенное среднее двух выборочных дисперсий, где веса задаются степенями свободы. Предполагается, что обе генеральные совокупности имеют одну и ту же базовую дисперсию.
Когда следует использовать объединенное стандартное отклонение?
Используйте объединенное стандартное отклонение, когда предполагаете однородность дисперсий между двумя группами, например в классическом t-критерии для двух выборок. Если предварительный тест (Левена, Бартлетта) показывает, что дисперсии существенно различаются, используйте t-критерий Уэлча, который не требует равенства дисперсий.
Что такое d Коэна и как его интерпретировать?
d Коэна — это стандартизированный размер эффекта, выражающий разницу средних в единицах объединенного стандартного отклонения. Значения примерно 0.2, 0.5 и 0.8 обычно описываются как малый, средний и большой эффект соответственно. Большой d Коэна означает, что две группы хорошо разделены относительно их общей изменчивости.
Почему в формуле деление идет на n₁+n₂−2?
Знаменатель n₁+n₂−2 представляет общее число степеней свободы, израсходованных на оценивание двух выборочных средних. Использование степеней свободы (а не n₁+n₂) дает несмещенную оценку дисперсии генеральной совокупности. Каждая выборка вносит nᵢ−1 степеней свободы в объединенную оценку.
Можно ли использовать объединенное стандартное отклонение для более чем двух групп?
Да. Объединенное стандартное отклонение можно расширить на k групп по формуле sp = √[Σ(nᵢ−1)sᵢ² / Σ(nᵢ−1)]. Это обобщение используется в ANOVA, где одно объединенное внутригрупповое стандартное отклонение (корень из средней квадратичной ошибки) служит оценкой общей дисперсии.
Как размер выборки влияет на объединенное стандартное отклонение?
Более крупные выборки имеют больший вес в объединенной оценке. Если n₁ >> n₂, объединенное СО будет в основном определяться дисперсией первой выборки. Это отражает принцип, что больше данных дает более надежную оценку дисперсии. Это также означает, что выбросы или нарушения предположения о равенстве дисперсий сильнее влияют на результат, когда одна выборка намного больше другой.