Histogramas para detectar valores atípicos
Un histograma puede ser una visualización muy útil para encontrar valores atípicos. Suelen hacerse evidentes cuando eliges un número adecuado de contenedores (bins) para el histograma. Recuerda que la raíz cuadrada del número de observaciones puede usarse como regla general para fijar el número de contenedores. Normalmente, los contenedores con menor altura contienen valores atípicos.
En este ejercicio, representarás el histograma de prices del ejercicio anterior. numpy y matplotlib.pyplot están disponibles con sus alias estándar.
Este ejercicio forma parte del curso
Detección de anomalías en Python
Instrucciones del ejercicio
- Calcula la raíz cuadrada de la longitud de
pricesy guárdala comon_bins. - Convierte
n_binsa entero. - Crea un histograma de
prices, estableciendo el número de contenedores enn_bins.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Find the square root of the length of prices
n_bins = ____
# Cast to an integer
n_bins = ____(____)
plt.figure(figsize=(8, 4))
# Create a histogram
plt.____(____, ____=____, color='red')
plt.show()