Identifikasi Nilai Ekstrem
Sekarang setelah Anda membuat DataFrame dengan persentase identifikasi diri ras Hispanik per negara bagian, Anda akan mengeksplorasinya lebih lanjut, dimulai dengan membuat boxplot menggunakan seaborn.
Anda juga akan mencari negara bagian dengan persentase Hispanik terbesar atau terkecil yang mengidentifikasi diri sebagai ras tertentu. Untuk melakukannya, Anda akan menerapkan metode squeeze(). Metode ini mengonversi DataFrame satu baris menjadi series (tanpa efek pada DataFrame dengan lebih dari satu baris).
pandas telah diimpor. DataFrame states_hr telah dimuat, yang berisi persentase identifikasi diri ras untuk 7 kategori ras yang berbeda.
Latihan ini adalah bagian dari kursus
Menganalisis Data Sensus AS dengan Python
Petunjuk latihan
- Buat boxplot dengan menyetel parameter
datake nama DataFrame. (orient = "h"akan memplot boxplot secara horizontal.) - Dengan menggunakan
squeeze, tampilkan negara bagian dengan nilai terbesar pada kolomhispanic_white. - Dengan menggunakan
squeeze, tampilkan negara bagian dengan nilai terkecil pada kolomhispanic_other. - Perhatikan bahwa sangat sedikit Hispanik yang mengidentifikasi diri sebagai Asia, tetapi ada satu negara bagian yang merupakan pencilan tinggi. Dengan menggunakan
squeeze, tampilkan negara bagian dengan nilai terbesar pada kolomhispanic_asian.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import seaborn and matplotlib.plt
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()
# Create a boxplot
sns.boxplot(data = ____, orient = "h")
plt.show()
# Show states with extreme values in various columns
print(states_hr.nlargest(1, ____).squeeze())
print(states_hr.nsmallest(____).____)
print(____)