Mulai sekarangMulai gratis

Artikel mana yang mirip dengan 'Cristiano Ronaldo'?

Dalam video, Anda mempelajari cara menggunakan fitur NMF dan cosine similarity untuk menemukan artikel yang serupa. Terapkan ini pada model NMF Anda untuk artikel-artikel populer di Wikipedia, dengan mencari artikel yang paling mirip dengan artikel tentang pesepak bola Cristiano Ronaldo. Fitur NMF yang Anda peroleh sebelumnya tersedia sebagai nmf_features, sedangkan titles adalah daftar judul artikel.

Latihan ini merupakan bagian dari kursus

Unsupervised Learning in Python

Lihat Kursus

Instruksi latihan

  • Impor normalize dari sklearn.preprocessing.
  • Terapkan fungsi normalize() pada nmf_features. Simpan hasilnya sebagai norm_features.
  • Buat DataFrame df dari norm_features, gunakan titles sebagai indeks.
  • Gunakan pengakses .loc[] dari df untuk memilih baris 'Cristiano Ronaldo'. Simpan hasilnya ke article.
  • Terapkan metode .dot() dari df pada article untuk menghitung cosine similarity setiap baris terhadap article.
  • Cetak hasil metode .nlargest() dari similarities untuk menampilkan artikel paling mirip. Ini sudah disiapkan untuk Anda, jadi klik 'Kirim Jawaban' untuk melihat hasilnya!

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Perform the necessary imports
import pandas as pd
from ____ import ____

# Normalize the NMF features: norm_features
norm_features = ____

# Create a DataFrame: df
df = ____

# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]

# Compute the dot products: similarities
similarities = ____

# Display those with the largest cosine similarity
print(similarities.nlargest())
Edit dan Jalankan Kode