Artikel mana yang mirip dengan 'Cristiano Ronaldo'?
Dalam video, Anda mempelajari cara menggunakan fitur NMF dan cosine similarity untuk menemukan artikel yang serupa.
Terapkan ini pada model NMF Anda untuk artikel-artikel populer di Wikipedia, dengan mencari artikel yang paling mirip dengan artikel tentang pesepak bola Cristiano Ronaldo. Fitur NMF yang Anda peroleh sebelumnya tersedia sebagai nmf_features, sedangkan titles adalah daftar judul artikel.
Latihan ini merupakan bagian dari kursus
Unsupervised Learning in Python
Instruksi latihan
- Impor
normalizedarisklearn.preprocessing. - Terapkan fungsi
normalize()padanmf_features. Simpan hasilnya sebagainorm_features. - Buat DataFrame
dfdarinorm_features, gunakantitlessebagai indeks. - Gunakan pengakses
.loc[]daridfuntuk memilih baris'Cristiano Ronaldo'. Simpan hasilnya kearticle. - Terapkan metode
.dot()daridfpadaarticleuntuk menghitung cosine similarity setiap baris terhadaparticle. - Cetak hasil metode
.nlargest()darisimilaritiesuntuk menampilkan artikel paling mirip. Ini sudah disiapkan untuk Anda, jadi klik 'Kirim Jawaban' untuk melihat hasilnya!
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Perform the necessary imports
import pandas as pd
from ____ import ____
# Normalize the NMF features: norm_features
norm_features = ____
# Create a DataFrame: df
df = ____
# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]
# Compute the dot products: similarities
similarities = ____
# Display those with the largest cosine similarity
print(similarities.nlargest())