NMF, belgelerin konularını öğrenir
Videoda, NMF belgeler üzerine uygulandığında, bileşenlerin belge konularına karşılık geldiğini ve NMF özelliklerinin belgeleri bu konulardan yeniden oluşturduğunu öğrendin. Wikipedia makalelerini kullanarak daha önce kurduğun NMF modeli için bunu kendin doğrula. Daha önce, 3. NMF özellik değerinin oyuncular Anne Hathaway ve Denzel Washington hakkındaki makalelerde yüksek olduğunu görmüştün. Bu egzersizde, ilgili NMF bileşeninin konusunu belirleyeceksin.
Daha önce kurduğun NMF modeli model olarak mevcut; words ise kelime-frekans dizisinin sütunlarını etiketleyen kelimelerin listesi.
İşini bitirdikten sonra, Anne Hathaway ve Denzel Washington hakkındaki makalelerin ortak paylaştığı konuyu fark etmek için bir an ayır!
Bu egzersiz
Python'da Unsupervised Learning
kursunun bir parçasıdırEgzersiz talimatları
pandas'ıpdolarak içe aktar.- Sütunların kelimelerle etiketlenmesi için
columns=wordsayarını kullanarak,model.components_'dan bircomponents_dfDataFrame'i oluştur. - DataFrame'in boyutlarını kontrol etmek için
components_df.shapedeğerini yazdır. components_dfDataFrame'inde.iloc[]kullanarak3numaralı satırı seç. Sonucucomponentdeğişkenine ata.component'ın.nlargest()metodunu çağır ve sonucu yazdır. Bu, o bileşen için en yüksek değerlere sahip beş kelimeyi verir.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import pandas
import pandas as pd
# Create a DataFrame: components_df
components_df = ____
# Print the shape of the DataFrame
print(components_df.shape)
# Select row 3: component
component = ____
# Print result of nlargest
print(component.nlargest())