Kejarangan matriks
Tantangan umum pada data penilaian dunia nyata adalah sebagian besar pengguna tidak akan memberi nilai pada sebagian besar item, dan sebagian besar item hanya dinilai oleh sedikit pengguna. Hal ini menghasilkan DataFrame yang sangat kosong atau jarang (sparse).
Pada latihan ini, Anda akan menghitung seberapa jarang data penilaian movie_lens dengan menghitung jumlah sel terisi dan membandingkannya dengan ukuran penuh DataFrame.
DataFrame user_ratings_df yang telah Anda gunakan pada latihan sebelumnya, berisi satu baris per pengguna dan satu kolom per film, telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Membangun Recommendation Engine di Python
Petunjuk latihan
- Hitung jumlah sel tidak kosong dalam
user_ratings_dfdan simpan hasilnya sebagaisparsity_count. - Hitung jumlah total sel dalam DataFrame
user_ratings_dfdan simpan sebagaifull_count. - Hitung kejarangan DataFrame dengan membagi jumlah sel tidak kosong dengan total jumlah sel dan cetak hasilnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Count the occupied cells
sparsity_count = user_ratings_df.____().____.____()
# Count all cells
full_count = user_ratings_df.____
# Find the sparsity of the DataFrame
sparsity = ____ / ____
print(sparsity)