TF-IDF DataFrame'i Oluşturma
Artık TF-IDF özelliklerini oluşturduğuna göre, bunları öneriler yapmak için kullanabileceğin bir formata getirmen gerekiyor.
Bunun için yine pandas'dan yararlanacak ve diziyi bir DataFrame içine alacaksın.
Verileri filtrelerken film adlarını kullanacağın için, başlıkları DataFrame'in index'ine atayabilirsin.
df_plots DataFrame'i senin için tekrar yüklendi. Title sütununda filmlerin adları, Plot sütununda ise özetleri yer alıyor.
Bu egzersiz
Python ile Öneri Motorları Geliştirme
kursunun bir parçasıdırEgzersiz talimatları
- Bir
TfidfVectorizeroluştur ve önceki egzersizde yaptığın gibi fit ve transform işlemlerini uygula. - Oluşturulan
vectorized_data'yı bir DataFrame içine al. Fit ve transform aşamasında üretilen özelliklerin adlarını sütun adları olarak kullan ve yeni DataFrame'initfidf_dfolarak ata. - Orijinal film başlıklarını yeni oluşturduğun
tfidf_dfDataFrame'inin index'ine ata.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
from sklearn.feature_extraction.text import TfidfVectorizer
# Instantiate the vectorizer object and transform the plot column
vectorizer = ____(max_df=0.7, min_df=2)
vectorized_data = vectorizer.____(df_plots['Plot'])
# Create Dataframe from TF-IDFarray
tfidf_df = pd.____(____.toarray(), columns=vectorizer.____())
# Assign the movie titles to the index and inspect
tfidf_df.____ = ____['Title']
print(tfidf_df.head())