MulaiMulai sekarang secara gratis

Menangani terlalu banyak kategori

Terkadang Anda kekurangan ruang gambar dan perlu menampilkan banyak data sekaligus. Di sini Anda ingin menampilkan lintasan sepanjang tahun untuk setiap polutan di setiap kota dalam himpunan data pollution. Setiap lintasan polutan akan diplot sebagai garis dengan nilai y yang sesuai dengan simpangan baku dari rata-rata tahunan. Ini berarti akan ada banyak garis sekaligus pada plot Anda — jauh lebih banyak daripada yang bisa dibedakan jelas hanya dengan warna.

Untuk mengatasinya, Anda memutuskan menyoroti sebagian kecil kombinasi kota–polutan (wanted_combos). Subkumpulan ini paling penting bagi Anda, dan lintasan lainnya akan memberikan konteks berharga untuk perbandingan. Untuk memfokuskan perhatian, Anda akan menyetel semua garis lintasan yang tidak disorot ke warna 'lainnya' yang sama.

Latihan ini adalah bagian dari kursus

Meningkatkan Visualisasi Data Anda di Python

Lihat Kursus

Petunjuk latihan

  • Ubah list comprehension untuk mengisolasi kombinasi kota dan polutan yang diinginkan (wanted_combos).
  • Beri tahu line plot untuk mewarnai garis berdasarkan kolom color_cats yang baru dibuat di DataFrame Anda.
  • Gunakan argumen units untuk menentukan bagaimana, yaitu dari kolom mana, titik data harus dihubungkan untuk membentuk setiap garis.
  • Nonaktifkan pembinningan titik dengan argumen estimator.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Choose the combos that get distinct colors
wanted_combos = ['Vandenberg Air Force Base NO2', 'Long Beach CO', 'Cincinnati SO2']

# Assign a new column to DataFrame for isolating the desired combos
city_pol_month['color_cats'] = [x if x in ____ else 'other' for x in city_pol_month['city_pol']]

# Plot lines with color driven by new column and lines driven by original categories
sns.lineplot(x = "month",
             y = "value",
             hue = '____',
             units = '____',
             estimator = ____,
             palette = 'Set2',
             data = city_pol_month)
plt.show()
Edit dan Jalankan Kode