MulaiMulai sekarang secara gratis

Identifikasi Nilai Ekstrem

Sekarang setelah Anda membuat DataFrame dengan persentase identifikasi diri ras Hispanik per negara bagian, Anda akan mengeksplorasinya lebih lanjut, dimulai dengan membuat boxplot menggunakan seaborn.

Anda juga akan mencari negara bagian dengan persentase Hispanik terbesar atau terkecil yang mengidentifikasi diri sebagai ras tertentu. Untuk melakukannya, Anda akan menerapkan metode squeeze(). Metode ini mengonversi DataFrame satu baris menjadi series (tanpa efek pada DataFrame dengan lebih dari satu baris).

pandas telah diimpor. DataFrame states_hr telah dimuat, yang berisi persentase identifikasi diri ras untuk 7 kategori ras yang berbeda.

Latihan ini adalah bagian dari kursus

Menganalisis Data Sensus AS dengan Python

Lihat Kursus

Petunjuk latihan

  • Buat boxplot dengan menyetel parameter data ke nama DataFrame. (orient = "h" akan memplot boxplot secara horizontal.)
  • Dengan menggunakan squeeze, tampilkan negara bagian dengan nilai terbesar pada kolom hispanic_white.
  • Dengan menggunakan squeeze, tampilkan negara bagian dengan nilai terkecil pada kolom hispanic_other.
  • Perhatikan bahwa sangat sedikit Hispanik yang mengidentifikasi diri sebagai Asia, tetapi ada satu negara bagian yang merupakan pencilan tinggi. Dengan menggunakan squeeze, tampilkan negara bagian dengan nilai terbesar pada kolom hispanic_asian.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import seaborn and matplotlib.plt
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()

# Create a boxplot
sns.boxplot(data = ____, orient = "h")
plt.show()

# Show states with extreme values in various columns
print(states_hr.nlargest(1, ____).squeeze())
print(states_hr.nsmallest(____).____)
print(____)
Edit dan Jalankan Kode