Histogramas para detecção de outliers
Um histograma pode ser um visual poderoso para encontrar outliers. Eles ficam evidentes quando você escolhe um número adequado de bins para o histograma. Lembre-se de que a raiz quadrada do número de observações pode servir como uma regra prática para definir a quantidade de bins. Normalmente, os bins com as menores alturas contêm os outliers.
Neste exercício, você vai traçar o histograma de prices do exercício anterior. numpy e matplotlib.pyplot estão disponíveis com seus aliases padrão.
Este exercício faz parte do curso
Detecção de Anomalias em Python
Instruções do exercício
- Encontre a raiz quadrada do tamanho de
pricese armazene comon_bins. - Converta
n_binspara inteiro. - Crie um histograma de
prices, definindo o número de bins comon_bins.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Find the square root of the length of prices
n_bins = ____
# Cast to an integer
n_bins = ____(____)
plt.figure(figsize=(8, 4))
# Create a histogram
plt.____(____, ____=____, color='red')
plt.show()