Artikel mana yang mirip dengan 'Cristiano Ronaldo'?
Dalam video, Anda mempelajari cara menggunakan fitur NMF dan cosine similarity untuk menemukan artikel yang serupa.
Terapkan ini pada model NMF Anda untuk artikel-artikel populer di Wikipedia, dengan mencari artikel yang paling mirip dengan artikel tentang pesepak bola Cristiano Ronaldo. Fitur NMF yang Anda peroleh sebelumnya tersedia sebagai nmf_features, sedangkan titles adalah daftar judul artikel.
Latihan ini adalah bagian dari kursus
Unsupervised Learning in Python
Petunjuk latihan
- Impor
normalizedarisklearn.preprocessing. - Terapkan fungsi
normalize()padanmf_features. Simpan hasilnya sebagainorm_features. - Buat DataFrame
dfdarinorm_features, gunakantitlessebagai indeks. - Gunakan pengakses
.loc[]daridfuntuk memilih baris'Cristiano Ronaldo'. Simpan hasilnya kearticle. - Terapkan metode
.dot()daridfpadaarticleuntuk menghitung cosine similarity setiap baris terhadaparticle. - Cetak hasil metode
.nlargest()darisimilaritiesuntuk menampilkan artikel paling mirip. Ini sudah disiapkan untuk Anda, jadi klik 'Kirim Jawaban' untuk melihat hasilnya!
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Perform the necessary imports
import pandas as pd
from ____ import ____
# Normalize the NMF features: norm_features
norm_features = ____
# Create a DataFrame: df
df = ____
# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]
# Compute the dot products: similarities
similarities = ____
# Display those with the largest cosine similarity
print(similarities.nlargest())