Калькулятор t-критерия для парных выборок - до и после
Выполните t-критерий для парных выборок, чтобы сравнить две связанные группы — измерения до/после, согласованные пары — и получить t-статистику, p-value и доверительный интервал.
Введите две группы данных одинаковой длины через запятую, задайте уровень значимости и тип теста, и сразу получите полный результат парного t-теста.
Калькулятор t-критерия для парных выборок - до и после
Выполните t-критерий для парных выборок, чтобы сравнить две связанные группы — измерения до/после, согласованные пары — и получить t-статистику, p-value и доверительный интервал.
О калькуляторе t-критерия для парных выборок
t-критерий для парных выборок (также называемый зависимым t-критерием или t-критерием для связанных выборок) — это параметрическая статистическая процедура, которая определяет, отличается ли средняя разность между двумя связанными наборами измерений статистически значимо от нуля (или от любого другого предполагаемого значения). Он называется «парным», потому что каждое наблюдение в группе 1 соответствует ровно одному наблюдению в группе 2 — оба измерения получены от одного и того же испытуемого, от сопоставленных участников или из одного и того же места, измеренного в два разных момента времени.
Самое распространённое применение — дизайн исследования «до и после»: исследователь измеряет характеристику (артериальное давление, балл теста, вес, продажи) до вмешательства, а затем снова после. Поскольку одни и те же люди измеряются дважды, группы не независимы — они коррелированы. Игнорировать эту корреляцию и использовать t-критерий для независимых выборок было бы ошибкой; это занизило бы точность сравнения, потому что не учитывается естественная межсубъектная вариабельность, которая сокращается при работе с разностями.
Вычислительный приём, делающий парный t-критерий элегантным, состоит в сведении задачи к одновыборочной. Для каждой пары i вычисляется разность d_i = Группа1_i − Группа2_i. Затем вопрос звучит так: отличается ли среднее этих разностей (d̄) статистически значимо от нуля? Так двухвыборочная задача превращается в одновыборочный t-тест по разностям. Статистика теста имеет вид t = (d̄ − μ₀) / (s_d / √n), где μ₀ — гипотетическая средняя разность (обычно 0), s_d — выборочное стандартное отклонение разностей, а n — число пар. При нулевой гипотезе эта статистика следует распределению Стьюдента с df = n − 1 степенями свободы.
p-value этой t-статистики показывает вероятность наблюдать среднюю разность не меньше d̄ по модулю, если истинная средняя разность в популяции равна μ₀. Если p-value ниже выбранного уровня значимости α, вы отвергаете нулевую гипотезу и заключаете, что между парными измерениями существует статистически значимая средняя разность. Доверительный интервал для d̄ даёт правдоподобный диапазон для истинной средней разности и часто информативнее одного только p-value.
Чтобы парный t-критерий был корректным, разности d_i должны быть приблизительно нормально распределены. Это предположение проверяют по гистограмме или нормальному Q-Q графику разностей. При n ≥ 30 центральная предельная теорема делает это допущение менее критичным, даже если отдельные разности не нормальны. Для небольших выборок с явно ненормальными разностями непараметрической альтернативой служит критерий Уилкоксона для связанных выборок.
Типичные применения включают медицинские исследования эффективности (до и после приёма препарата), педагогические исследования (предтест и посттест), исследования питания и фитнеса (базовые и последующие измерения), а также бизнес-аналитику (продажи до и после рекламной кампании). В каждом случае ключевое требование одно: каждая пара значений должна происходить от одного и того же человека, объекта или согласованной единицы — а не из двух независимых групп.
Примеры с расчётом
Три сценария «до и после» с реалистичными данными, чтобы показать результат парного t-теста.
| Дизайн исследования | t-статистика / p-value | Вывод |
|---|---|---|
| Давление до: 140,135,150,155,130,142,138,147,152,133 / после: 132,130,145,148,125,135,130,140,145,128 (двусторонний, α=0.05, n=10) | t ≈ 16.00, df = 9, p < 0.001 | Очень значимо. Препарат снизил систолическое давление в среднем на 6.4 мм рт. ст. у 10 пациентов. |
| Баллы до: 75,80,82,70,88,65,90,78 / после: 85,85,88,78,92,75,95,85 (двусторонний, α=0.05, n=8) | t ≈ −8.47, df = 7, p < 0.001 | Значимое улучшение. После программы занятий студенты в среднем набрали на 6.9 балла больше. |
| Недельные продажи до: 500,550,480,600,520,530 / после: 540,580,500,650,550,560 (двусторонний, α=0.05, n=6) | t ≈ −7.91, df = 5, p < 0.001 | Рекламная кампания значительно увеличила недельные продажи в среднем на 33.3 единицы на магазин. |
Как пользоваться калькулятором t-критерия для парных выборок
- Введите данные группы 1 (например, значения «до») в первое поле в виде списка через запятую.
- Введите данные группы 2 (например, значения «после») во второе поле. Обе группы должны содержать одинаковое число значений; первое число группы 1 сопоставляется с первым числом группы 2, и так далее.
- Задайте уровень значимости α (0.01, 0.05 или 0.10) и гипотетическую среднюю разность μ₀ (обычно 0). Выберите тип теста (двусторонний, правосторонний или левосторонний).
- Нажмите «Рассчитать», чтобы увидеть t-статистику, степени свободы, p-value, среднюю разность, стандартное отклонение разностей и 95% доверительный интервал.
- Сравните p-value с α. Если p ≤ α, отклоните H₀ и сделайте вывод о статистически значимой средней разности. Если p > α, нет оснований отклонить H₀.
Часто задаваемые вопросы
Когда использовать парный t-тест вместо t-теста для независимых выборок?
Используйте парный t-тест, когда каждое наблюдение в одной группе естественно сопоставлено или связано ровно с одним наблюдением в другой группе — например, один и тот же человек до и после лечения, или два брата/сестры, которым назначили разные диеты. Если две группы независимы (разные, несвязанные люди без сопоставления), используйте t-тест для независимых выборок.
Что такое гипотетическая средняя разность μ₀?
μ₀ — это значение, которому, по вашей гипотезе, равна истинная средняя разность при нулевой гипотезе. Для большинства задач — проверки, есть ли у вмешательства эффект, — μ₀ = 0. Для более конкретных гипотез, например проверки, снижает ли препарат давление хотя бы на 10 мм рт. ст., вы задали бы μ₀ = 10.
Что если мои разности не распределены нормально?
Парный t-тест предполагает, что разности приблизительно нормальны. При n ≥ 30 парах центральная предельная теорема делает это допущение менее критичным. Для малых выборок с явно ненормальными разностями (проверьте гистограмму) непараметрической и устойчивой альтернативой является критерий Уилкоксона для связанных выборок, который не требует нормальности.
Как интерпретировать доверительный интервал?
95% доверительный интервал даёт диапазон правдоподобных значений истинной средней разности. Если интервал не включает ноль, результат значим при α = 0.05. Интервал информативнее одного p-value, потому что показывает величину и направление эффекта. Например, интервал (2.3, 9.8) говорит, что эффект значим и находится от малого до умеренно большого.
Можно ли делать односторонний парный t-тест?
Да. Выберите «Правосторонний», если предполагаете, что группа 1 > группа 2 (положительная средняя разность), или «Левосторонний», если предполагаете, что группа 1 < группа 2 (отрицательная средняя разность). Односторонний тест более мощный, но допустим только если направление эффекта было задано до сбора данных. Выбирать односторонний тест только потому, что двусторонний результат оказался пограничным, — это p-hacking.
Что на самом деле означает значимый результат?
Значимый результат (p ≤ α) означает, что наблюдаемая средняя разность вряд ли возникла случайно, если бы нулевая гипотеза была верна. Но это не доказывает, что нулевая гипотеза ложна, и не гарантирует, что эффект большой или клинически важный. Всегда указывайте среднюю разность d̄, её доверительный интервал и размер эффекта (например, d Коэна = d̄ / s_d), чтобы читатели могли оценить практическую значимость.