TED konuşmaları için tf-idf vektörleri
Bu egzersizde, 500 TED Konuşmasının dökümlerini içeren ted adlı bir korpus verildi. Görevin bu konuşmalar için tf-idf vektörlerini üretmek.
İlerideki bir derste, bu vektörleri döküme dayalı benzer konuşmalar için öneriler üretmekte kullanacağız.
Bu egzersiz
Python ile NLP için Özellik Mühendisliği
kursunun bir parçasıdırEgzersiz talimatları
sklearniçindenTfidfVectorizer'ı içe aktar.- Bir
TfidfVectorizernesnesi oluştur. Adıvectorizerolsun. fit_transform()metodunu kullanaraktediçintfidf_matrixüret.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import TfidfVectorizer
from ____ import ____
# Create TfidfVectorizer object
____
# Generate matrix of word vectors
tfidf_matrix = vectorizer.____(____)
# Print the shape of tfidf_matrix
print(tfidf_matrix.shape)