BaşlayınÜcretsiz Başlayın

NMF, belgelerin konularını öğrenir

Videoda, NMF belgeler üzerine uygulandığında, bileşenlerin belge konularına karşılık geldiğini ve NMF özelliklerinin belgeleri bu konulardan yeniden oluşturduğunu öğrendin. Wikipedia makalelerini kullanarak daha önce kurduğun NMF modeli için bunu kendin doğrula. Daha önce, 3. NMF özellik değerinin oyuncular Anne Hathaway ve Denzel Washington hakkındaki makalelerde yüksek olduğunu görmüştün. Bu egzersizde, ilgili NMF bileşeninin konusunu belirleyeceksin.

Daha önce kurduğun NMF modeli model olarak mevcut; words ise kelime-frekans dizisinin sütunlarını etiketleyen kelimelerin listesi.

İşini bitirdikten sonra, Anne Hathaway ve Denzel Washington hakkındaki makalelerin ortak paylaştığı konuyu fark etmek için bir an ayır!

Bu egzersiz

Python'da Unsupervised Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • pandaspd olarak içe aktar.
  • Sütunların kelimelerle etiketlenmesi için columns=words ayarını kullanarak, model.components_'dan bir components_df DataFrame'i oluştur.
  • DataFrame'in boyutlarını kontrol etmek için components_df.shape değerini yazdır.
  • components_df DataFrame'inde .iloc[] kullanarak 3 numaralı satırı seç. Sonucu component değişkenine ata.
  • component'ın .nlargest() metodunu çağır ve sonucu yazdır. Bu, o bileşen için en yüksek değerlere sahip beş kelimeyi verir.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import pandas
import pandas as pd

# Create a DataFrame: components_df
components_df = ____

# Print the shape of the DataFrame
print(components_df.shape)

# Select row 3: component
component = ____

# Print result of nlargest
print(component.nlargest())
Kodu Düzenle ve Çalıştır