Kehilangan informasi dalam faktorisasi

Anda mungkin bertanya-tanya bagaimana faktor dengan kolom yang jauh lebih sedikit dapat meringkas DataFrame yang lebih besar tanpa kehilangan informasi. Faktanya, tidak demikian — faktor yang kita buat umumnya merupakan pendekatan (aproksimasi) yang mendekati data, karena tak terelakkan akan ada sebagian informasi yang hilang. Artinya, nilai prediksi mungkin tidak persis sama, tetapi seharusnya cukup dekat untuk tetap berguna.

Dalam latihan ini, Anda akan meninjau DataFrame asli sebelum faktorisasi yang sama dari latihan sebelumnya yang dimuat sebagai original_df, dan membandingkannya dengan hasil perkalian dua faktornya, user_matrix dan item_matrix.

Latihan ini merupakan bagian dari kursus

Membangun Recommendation Engine di Python

Lihat Kursus

Instruksi latihan

Cari hasil kali titik (dot product) dari user_matrix dan item_matrix lalu simpan sebagai predictions_df.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

import numpy as np

# Multiply the user and item matrices
predictions_df = ____.____(____, ____)
# Inspect the recreated DataFrame
print(predictions_df)

# Inspect the original DataFrame and compare
print(original_df)

Edit dan Jalankan Kode