MulaiMulai sekarang secara gratis

Kejarangan matriks

Tantangan umum pada data penilaian dunia nyata adalah sebagian besar pengguna tidak akan memberi nilai pada sebagian besar item, dan sebagian besar item hanya dinilai oleh sedikit pengguna. Hal ini menghasilkan DataFrame yang sangat kosong atau jarang (sparse).

Pada latihan ini, Anda akan menghitung seberapa jarang data penilaian movie_lens dengan menghitung jumlah sel terisi dan membandingkannya dengan ukuran penuh DataFrame. DataFrame user_ratings_df yang telah Anda gunakan pada latihan sebelumnya, berisi satu baris per pengguna dan satu kolom per film, telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Membangun Recommendation Engine di Python

Lihat Kursus

Petunjuk latihan

  • Hitung jumlah sel tidak kosong dalam user_ratings_df dan simpan hasilnya sebagai sparsity_count.
  • Hitung jumlah total sel dalam DataFrame user_ratings_df dan simpan sebagai full_count.
  • Hitung kejarangan DataFrame dengan membagi jumlah sel tidak kosong dengan total jumlah sel dan cetak hasilnya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Count the occupied cells
sparsity_count = user_ratings_df.____().____.____()

# Count all cells
full_count = user_ratings_df.____

# Find the sparsity of the DataFrame
sparsity = ____ / ____
print(sparsity)
Edit dan Jalankan Kode