BaşlayınÜcretsiz Başlayın

TF-IDF DataFrame'i Oluşturma

Artık TF-IDF özelliklerini oluşturduğuna göre, bunları öneriler yapmak için kullanabileceğin bir formata getirmen gerekiyor. Bunun için yine pandas'dan yararlanacak ve diziyi bir DataFrame içine alacaksın. Verileri filtrelerken film adlarını kullanacağın için, başlıkları DataFrame'in index'ine atayabilirsin.

df_plots DataFrame'i senin için tekrar yüklendi. Title sütununda filmlerin adları, Plot sütununda ise özetleri yer alıyor.

Bu egzersiz

Python ile Öneri Motorları Geliştirme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Bir TfidfVectorizer oluştur ve önceki egzersizde yaptığın gibi fit ve transform işlemlerini uygula.
  • Oluşturulan vectorized_data'yı bir DataFrame içine al. Fit ve transform aşamasında üretilen özelliklerin adlarını sütun adları olarak kullan ve yeni DataFrame'ini tfidf_df olarak ata.
  • Orijinal film başlıklarını yeni oluşturduğun tfidf_df DataFrame'inin index'ine ata.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

from sklearn.feature_extraction.text import TfidfVectorizer

# Instantiate the vectorizer object and transform the plot column
vectorizer = ____(max_df=0.7, min_df=2)
vectorized_data = vectorizer.____(df_plots['Plot']) 

# Create Dataframe from TF-IDFarray
tfidf_df = pd.____(____.toarray(), columns=vectorizer.____())

# Assign the movie titles to the index and inspect
tfidf_df.____ = ____['Title']
print(tfidf_df.head())
Kodu Düzenle ve Çalıştır