MulaiMulai sekarang secara gratis

Artikel mana yang mirip dengan 'Cristiano Ronaldo'?

Dalam video, Anda mempelajari cara menggunakan fitur NMF dan cosine similarity untuk menemukan artikel yang serupa. Terapkan ini pada model NMF Anda untuk artikel-artikel populer di Wikipedia, dengan mencari artikel yang paling mirip dengan artikel tentang pesepak bola Cristiano Ronaldo. Fitur NMF yang Anda peroleh sebelumnya tersedia sebagai nmf_features, sedangkan titles adalah daftar judul artikel.

Latihan ini adalah bagian dari kursus

Unsupervised Learning in Python

Lihat Kursus

Petunjuk latihan

  • Impor normalize dari sklearn.preprocessing.
  • Terapkan fungsi normalize() pada nmf_features. Simpan hasilnya sebagai norm_features.
  • Buat DataFrame df dari norm_features, gunakan titles sebagai indeks.
  • Gunakan pengakses .loc[] dari df untuk memilih baris 'Cristiano Ronaldo'. Simpan hasilnya ke article.
  • Terapkan metode .dot() dari df pada article untuk menghitung cosine similarity setiap baris terhadap article.
  • Cetak hasil metode .nlargest() dari similarities untuk menampilkan artikel paling mirip. Ini sudah disiapkan untuk Anda, jadi klik 'Kirim Jawaban' untuk melihat hasilnya!

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Perform the necessary imports
import pandas as pd
from ____ import ____

# Normalize the NMF features: norm_features
norm_features = ____

# Create a DataFrame: df
df = ____

# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]

# Compute the dot products: similarities
similarities = ____

# Display those with the largest cosine similarity
print(similarities.nlargest())
Edit dan Jalankan Kode