Fitur NMF dari artikel Wikipedia
Sekarang Anda akan mengeksplorasi fitur NMF yang Anda buat pada latihan sebelumnya. Solusi untuk latihan sebelumnya sudah dimuat, sehingga array nmf_features tersedia. Juga tersedia daftar titles yang berisi judul setiap artikel Wikipedia.
Saat menelusuri fitur, perhatikan bahwa untuk kedua aktor tersebut, fitur NMF ke-3 memiliki nilai yang paling tinggi. Ini berarti kedua artikel direkonstruksi terutama menggunakan komponen NMF ke-3. Pada video berikutnya, Anda akan melihat alasannya: komponen NMF merepresentasikan topik (misalnya, akting!).
Latihan ini adalah bagian dari kursus
Unsupervised Learning in Python
Petunjuk latihan
- Impor
pandassebagaipd. - Buat DataFrame
dfdarinmf_featuresmenggunakanpd.DataFrame(). Atur indeksnya ketitlesmenggunakanindex=titles. - Gunakan aksesori
.loc[]daridfuntuk memilih baris dengan judul'Anne Hathaway', lalu cetak hasilnya. Ini adalah fitur NMF untuk artikel tentang aktris Anne Hathaway. - Ulangi langkah terakhir untuk
'Denzel Washington'(aktor lainnya).
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import pandas
____
# Create a pandas DataFrame: df
df = ____
# Print the row for 'Anne Hathaway'
print(____)
# Print the row for 'Denzel Washington'
print(____)