Калькулятор парадокса ложноположительного - Теорема Байеса
Рассчитайте реальную вероятность наличия заболевания после положительного теста. Введите распространённость, чувствительность и специфичность, чтобы увидеть, как низкая базовая частота создаёт парадокс ложноположительных результатов.
Введите распространённость заболевания в популяции, а также чувствительность и специфичность теста, затем нажмите, чтобы увидеть реальную вероятность того, что положительный результат действительно верен.
Калькулятор парадокса ложноположительного
Найти истинную вероятность заболевания при положительном результате теста
О калькуляторе парадокса ложноположительного
Парадокс ложноположительного — также известный как ошибка базовой частоты — это статистическое явление, противоречащее интуиции, при котором число ложноположительных результатов теста превышает число истинно положительных, даже если сам тест очень точен. Парадокс возникает, когда проверяемое заболевание встречается редко: небольшая группа действительно больных даёт гораздо меньше истинно положительных результатов, чем гораздо более крупная группа здоровых людей даёт ложных тревог, даже при низкой частоте ложноположительных.
Математическая основа парадокса — теорема Байеса. При известной распространённости P(D) заболевания, чувствительности теста (истинно положительная доля) Se и специфичности (истинно отрицательная доля) Sp положительная прогностическая ценность (PPV) — то есть вероятность того, что человек с положительным результатом действительно болен, — вычисляется так: PPV = (Se × P(D)) / (Se × P(D) + (1 − Sp) × (1 − P(D))). Когда P(D) очень мала, знаменатель определяется членом ложноположительных результатов (1 − Sp) × (1 − P(D)), и даже крошечная частота ложноположительных на большой здоровой популяции перевешивает небольшое число истинно положительных.
Классический пример: пусть болезнь поражает 0,1% населения (1 из 1 000), а тест имеет чувствительность 99% и специфичность 99%. Из 100 000 человек примерно 100 больны (0,1%), а 99 900 — нет. Тест правильно выявляет 99 из 100 больных (истинно положительные), но также ошибочно помечает 1% из 99 900 здоровых — около 999 ложноположительных. Таким образом, среди всех 1 098 людей с положительным тестом только 99 действительно больны: PPV всего 9%. Тест с точностью 99% даёт 91% ложных тревог, потому что распространённость слишком низкая.
Этот принцип имеет серьёзные последствия в медицине, безопасности и технологиях. В программах медицинского скрининга массовое тестирование редких болезней — даже очень точными тестами — может создавать большое число тревожных, но на самом деле здоровых пациентов, тратя ресурсы и причиняя вред. Поэтому в рекомендациях по общественному здравоохранению массовый скрининг часто ограничивают подгруппами с более высокой распространённостью, где PPV клинически приемлема. В сфере безопасности системы распознавания лиц с очень высокой точностью всё равно могут давать тысячи ложноположительных результатов при проверке миллионов невинных путешественников на наличие единичных подозреваемых. В фильтрации спама высокие уровни ложноположительных подрывают доверие, даже если система почти весь спам ловит.
Решение и в медицине, и в политике одно: применять теорему Байеса и учитывать априорную вероятность (распространённость) до интерпретации любого результата. Положительный скрининговый результат не означает, что у вас уже есть заболевание — это означает, что вероятность заболевания выросла от популяционной распространённости до PPV, которая всё ещё может быть очень низкой. Затем подтверждающий тест с большей специфичностью снова обновляет вероятность, обычно до значительно более высокого значения, достаточного для клинического действия. Этот калькулятор делает такие рассуждения прозрачными и интерактивными, позволяя врачам, исследователям и политикам изучать, как изменения распространённости, чувствительности и специфичности сдвигают PPV и структуру популяции.
Парадокс ложноположительного — примеры
Четыре сценария, показывающие, как распространённость доминирует над точностью теста при определении истинной прогностической ценности.
| Ввод | PPV | Контекст |
|---|---|---|
| Распространённость 0.1%, Чувствительность 99%, Специфичность 99% | PPV ≈ 9.0% | Скрининг редкого заболевания. Несмотря на тест с точностью 99%, 91 из 100 положительных результатов — ложные тревоги: классический парадокс ложноположительного. |
| Распространённость 10%, Чувствительность 95%, Специфичность 90% | PPV ≈ 51.4% | Более распространённое состояние. Более высокая распространённость резко повышает PPV; примерно половина положительных результатов оказывается истинной. |
| Распространённость 1%, Чувствительность 99.9%, Специфичность 98% | PPV ≈ 33.5% | Аналогия со спам-фильтром. Даже отличный фильтр создаёт много ложноположительных срабатываний, когда спам составляет лишь 1% всей почты. |
| Распространённость 0.01%, Чувствительность 99.5%, Специфичность 99% | PPV ≈ 0.99% | Аэропортовый сканер для очень редкой угрозы. 99 из 100 тревог — ложные, что иллюстрирует проблему поиска иголки в стоге сена. |
Как пользоваться калькулятором парадокса ложноположительного
- Введите распространённость заболевания — процент населения, у которого оно есть. Например, если болен 1 человек из 200, введите 0.5.
- Введите чувствительность теста (истинно положительную долю): процент действительно больных людей, которых тест правильно определяет как положительных.
- Введите специфичность теста (истинно отрицательную долю): процент действительно здоровых людей, которых тест правильно определяет как отрицательных.
- Нажмите «Рассчитать вероятность». Калькулятор применит теорему Байеса и покажет PPV (вероятность наличия заболевания при положительном тесте) и NPV (вероятность отсутствия заболевания при отрицательном тесте), а также разбиение на истинно/ложноположительные и истинно/ложноотрицательные на 100 000 человек.
- Изменяйте значения, чтобы увидеть, как распространённость, чувствительность и специфичность сдвигают PPV — вы заметите, что именно распространённость сильнее всего влияет на значимость положительного теста.
Парадокс ложноположительного — FAQ
Что такое парадокс ложноположительного?
Парадокс ложноположительного возникает, когда число ложноположительных результатов теста превышает число истинно положительных, даже если тест точен. Это происходит потому, что низкая распространённость означает: большая здоровая популяция даёт много ложных тревог — больше, чем небольшая больная популяция даёт истинных тревог, — даже при низкой частоте ложноположительных.
Что такое чувствительность и специфичность?
Чувствительность (истинно положительная доля) — это вероятность того, что у человека с заболеванием тест окажется положительным. Специфичность (истинно отрицательная доля) — это вероятность того, что у человека без заболевания тест окажется отрицательным. Тест с чувствительностью 95% выявляет 95 из 100 случаев; тест со специфичностью 90% правильно отбраковывает 90 из 100 здоровых людей.
Что такое PPV и почему он отличается от точности?
PPV (положительная прогностическая ценность) — это вероятность того, что положительный результат отражает истинно положительный случай, то есть человек действительно болен. Точность показывает, как часто тест в целом бывает верным. PPV сильно зависит от распространённости, а точность — нет. Тест может быть точным на 99% и всё равно иметь PPV ниже 10%, если заболевание редкое.
Как повысить PPV теста?
Самые эффективные способы повысить PPV — увеличить специфичность теста (снизить частоту ложноположительных), ограничить тестирование подгруппами с более высокой распространённостью, где априорная вероятность уже выше, и использовать последовательные подтверждающие тесты. При последовательном тестировании положительный результат первого скрининга становится новым входом 'распространённости' для второго, более специфичного подтверждающего теста, который обновляет вероятность до гораздо более высокого и клинически полезного значения.
Что показывает NPV?
NPV (отрицательная прогностическая ценность) — это вероятность того, что у человека с отрицательным тестом действительно нет заболевания. Для редких болезней NPV обычно очень высок: при распространённости 0,1% почти каждый отрицательный результат — истинно отрицательный. Высокий NPV означает, что отрицательный результат очень успокаивает. NPV снижается по мере роста распространённости.
Почему распространённость важнее точности теста?
При очень низкой распространённости даже крошечная частота ложноположительных на огромной здоровой популяции перекрывает истинно положительные случаи в маленькой больной группе. Удвоение специфичности с 95% до 97.5% лишь вдвое уменьшает ложноположительные на человека, а удвоение распространённости удваивает число истинно положительных — поэтому распространённость влияет на PPV гораздо сильнее, чем точность.