Histogram untuk deteksi outlier
Histogram dapat menjadi visual yang kuat untuk menemukan outlier. Outlier akan terlihat jika jumlah bin yang sesuai dipilih untuk histogram. Ingat bahwa akar kuadrat dari jumlah observasi dapat digunakan sebagai aturan praktis untuk menentukan jumlah bin. Biasanya, bin dengan tinggi terendah akan memuat outlier.
Dalam latihan ini, Anda akan memplot histogram prices dari latihan sebelumnya. numpy dan matplotlib.pyplot tersedia dengan alias standarnya.
Latihan ini adalah bagian dari kursus
Deteksi Anomali dengan Python
Petunjuk latihan
- Cari akar kuadrat dari panjang
pricesdan simpan sebagain_bins. - Ubah
n_binsmenjadi bilangan bulat. - Buat histogram
pricesdengan menetapkan jumlah bin ken_bins.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Find the square root of the length of prices
n_bins = ____
# Cast to an integer
n_bins = ____(____)
plt.figure(figsize=(8, 4))
# Create a histogram
plt.____(____, ____=____, color='red')
plt.show()