Kehilangan informasi dalam faktorisasi
Anda mungkin bertanya-tanya bagaimana faktor dengan kolom yang jauh lebih sedikit dapat meringkas DataFrame yang lebih besar tanpa kehilangan informasi. Faktanya, tidak demikian — faktor yang kita buat umumnya merupakan pendekatan (aproksimasi) yang mendekati data, karena tak terelakkan akan ada sebagian informasi yang hilang. Artinya, nilai prediksi mungkin tidak persis sama, tetapi seharusnya cukup dekat untuk tetap berguna.
Dalam latihan ini, Anda akan meninjau DataFrame asli sebelum faktorisasi yang sama dari latihan sebelumnya yang dimuat sebagai original_df, dan membandingkannya dengan hasil perkalian dua faktornya, user_matrix dan item_matrix.
Latihan ini adalah bagian dari kursus
Membangun Recommendation Engine di Python
Petunjuk latihan
- Cari hasil kali titik (dot product) dari
user_matrixdanitem_matrixlalu simpan sebagaipredictions_df.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
import numpy as np
# Multiply the user and item matrices
predictions_df = ____.____(____, ____)
# Inspect the recreated DataFrame
print(predictions_df)
# Inspect the original DataFrame and compare
print(original_df)