TED konuşmaları için tf-idf vektörleri
Bu egzersizde, 500 TED Konuşmasının dökümlerini içeren ted adlı bir korpus verildi. Görevin bu konuşmalar için tf-idf vektörlerini üretmek.
İlerideki bir derste, bu vektörleri döküme dayalı benzer konuşmalar için öneriler üretmekte kullanacağız.
Bu egzersiz, kursun bir parçasıdır
Python ile NLP için Özellik Mühendisliği
Egzersiz talimatları
sklearniçindenTfidfVectorizer'ı içe aktar.- Bir
TfidfVectorizernesnesi oluştur. Adıvectorizerolsun. fit_transform()metodunu kullanaraktediçintfidf_matrixüret.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Import TfidfVectorizer
from ____ import ____
# Create TfidfVectorizer object
____
# Generate matrix of word vectors
tfidf_matrix = vectorizer.____(____)
# Print the shape of tfidf_matrix
print(tfidf_matrix.shape)