Calculadora de vallas superior e inferior IQR
Identifica valores atípicos estadísticos en tu conjunto de datos con el método de vallas del rango intercuartílico (IQR). Ingresa números separados por comas para obtener al instante Q1, Q3, IQR y ambas vallas.
Ingresa tus valores de datos separados por comas, haz clic en Calcular y consulta la valla superior, la valla inferior y cualquier valor atípico del conjunto de datos.
Calculadora de vallas superior e inferior IQR
Identifica valores atípicos estadísticos en tu conjunto de datos con el método de vallas del rango intercuartílico (IQR). Ingresa números separados por comas para obtener al instante Q1, Q3, IQR y ambas vallas.
Acerca de la calculadora de vallas superior e inferior
El método de vallas superior e inferior es la técnica estándar para identificar valores atípicos en un conjunto de datos mediante el rango intercuartílico (IQR). Desarrollado como parte del marco de análisis exploratorio de datos de John Tukey en 1977, ofrece una forma robusta y no paramétrica de señalar observaciones inusuales sin asumir que los datos siguen una distribución particular. El método se enseña ampliamente en cursos introductorios de estadística y es el enfoque predeterminado para detectar valores atípicos en diagramas de caja y bigotes.
El cálculo comienza ordenando el conjunto de datos y encontrando el primer y tercer cuartil. Q1 (percentil 25) es el valor por debajo del cual cae el 25% de los datos, mientras que Q3 (percentil 75) es el valor por debajo del cual cae el 75%. El IQR es simplemente Q3 menos Q1 y representa la dispersión de la mitad central de los datos. Como el IQR ignora los valores extremos en ambos extremos de la distribución, es resistente a los mismos valores atípicos que intenta detectar, una propiedad que hace que el método de vallas sea más confiable que los métodos basados en el rango.
Una vez calculado el IQR, las vallas se fijan en 1.5 × IQR por debajo de Q1 (valla inferior) y 1.5 × IQR por encima de Q3 (valla superior). Cualquier punto de datos por debajo de la valla inferior o por encima de la valla superior se clasifica como valor atípico. Tukey eligió empíricamente el multiplicador 1.5 porque funciona bien con datos aproximadamente normales: en una distribución normal, esta regla marca alrededor del 0.7% de las observaciones como valores atípicos, lo que corresponde a valores a más de unas 2.7 desviaciones estándar de la media.
Para valores atípicos más extremos, algunas aplicaciones usan un multiplicador de 3 en lugar de 1.5 y etiquetan esos puntos como valores atípicos lejanos o extremos. Los puntos fuera de la valla de 1.5 × IQR pero dentro de la valla de 3 × IQR a veces se denominan valores atípicos leves. Esta calculadora usa la regla estándar de 1.5 × IQR, adecuada para la mayoría de los análisis exploratorios.
La detección de valores atípicos es un paso crítico en la limpieza de datos, el control de calidad y el modelado estadístico. En manufactura, una medición de proceso fuera de la valla podría indicar una unidad defectuosa o un error de medición. En finanzas, los rendimientos extremos podrían señalar errores de datos, anomalías del mercado o eventos reales que requieren investigación. En investigación clínica, se identifican y revisan valores fisiológicamente imposibles. En aprendizaje automático, los valores atípicos pueden distorsionar el entrenamiento del modelo si no se tratan.
Es importante recordar que los valores atípicos estadísticos no son necesariamente valores erróneos. Un valor atípico es simplemente una observación inusualmente alejada del grueso de los datos según la regla IQR. Se requiere investigación para determinar si el valor representa un evento extremo genuino, un error de medición o un error de ingreso de datos.
Ejemplos de valla superior e inferior
Ejemplos resueltos paso a paso que muestran cómo el método de vallas identifica valores atípicos en conjuntos de datos típicos.
| Conjunto de datos | Vallas y valores atípicos | Interpretación |
|---|---|---|
| 10, 12, 14, 16, 18, 20, 100 | Inferior: 4 | Superior: 28 | Atípico: 100 | Q1=13, Q3=19, IQR=6. Valla inferior = 13 − 9 = 4. Valla superior = 19 + 9 = 28. El valor 100 supera la valla superior y se marca como atípico. |
| 5, 7, 8, 9, 10, 11, 12, 14 | Inferior: 2.5 | Superior: 16.5 | Sin atípicos | Q1=7.75, Q3=11.25, IQR=3.5. Las vallas son 2.5 y 16.5. Todos los valores (5 a 14) caen dentro de las vallas, por lo que no hay valores atípicos. |
| 2, 3, 5, 7, 8, 9, 10, 11, 12, 50 | Inferior: −2.375 | Superior: 18.625 | Atípico: 50 | Q1=5.5, Q3=10.75, IQR=5.25. Valla superior = 10.75 + 7.875 = 18.625. El valor 50 está muy por encima de la valla superior y es un claro valor atípico. |
Cómo usar la calculadora de vallas
- Escribe tus valores de datos en el campo de entrada, separados por comas o espacios. Necesitas al menos 4 valores para calcular cuartiles significativos.
- Haz clic en Calcular para obtener Q1, Q3, el IQR, la valla inferior (Q1 − 1.5 × IQR) y la valla superior (Q3 + 1.5 × IQR).
- Revisa los valores de valla resaltados: cualquier punto de datos por debajo de la valla inferior o por encima de la valla superior es un valor atípico.
- Consulta la sección Valores atípicos para ver los valores marcados específicos listados explícitamente.
- Haz clic en Restablecer para borrar la entrada y empezar de nuevo con otro conjunto de datos.
Preguntas frecuentes sobre vallas superior e inferior
¿Qué son las vallas superior e inferior?
La valla superior es Q3 + 1.5 × IQR y la valla inferior es Q1 − 1.5 × IQR. Cualquier punto de datos fuera de estas vallas se considera un valor atípico. Las vallas crean un rango que encierra la dispersión esperada de una distribución aproximadamente acampanada.
¿Por qué usar 1.5 veces el IQR?
John Tukey eligió el multiplicador 1.5 porque es aproximadamente óptimo para detectar valores atípicos en datos normales manteniendo baja la tasa de falsos positivos. En una distribución normal marca alrededor del 0.7% de las observaciones. Duplicar el multiplicador a 3 captura solo valores atípicos extremos.
¿Qué es el IQR y cómo se calcula?
El IQR (rango intercuartílico) es Q3 menos Q1 y representa la dispersión del 50% central de los datos. Se calcula ordenando los datos, encontrando el percentil 25 (Q1) y el percentil 75 (Q3), y luego restando. El IQR es resistente a valores atípicos porque ignora el 25% superior e inferior de los valores.
¿Un valor atípico significa que los datos están mal?
No necesariamente. Un valor atípico es simplemente una observación inusualmente extrema en relación con el grueso de los datos. Podría ser un evento extremo genuino, un error de medición o un error de ingreso de datos. Cada valor marcado debe investigarse en contexto antes de eliminarse o corregirse.
¿Cómo se relacionan las vallas con los diagramas de caja?
Las vallas superior e inferior definen los bigotes en un diagrama de caja estándar de Tukey. La caja cubre el IQR (Q1 a Q3), la línea dentro de la caja es la mediana y los bigotes se extienden hasta los puntos de datos más extremos que aún están dentro de las vallas. Los puntos más allá de los bigotes se grafican individualmente como puntos atípicos.
¿El método de vallas es adecuado para conjuntos de datos pequeños?
El método funciona mejor con al menos 10 a 20 observaciones. Con menos valores, las estimaciones de cuartiles son imprecisas y las vallas pueden ser poco confiables. Para conjuntos de datos muy pequeños, considera examinar todos los valores visualmente en lugar de depender solo de la regla automática de vallas.