BaşlayınÜcretsiz başlayın

TED konuşmaları için tf-idf vektörleri

Bu egzersizde, 500 TED Konuşmasının dökümlerini içeren ted adlı bir korpus verildi. Görevin bu konuşmalar için tf-idf vektörlerini üretmek.

İlerideki bir derste, bu vektörleri döküme dayalı benzer konuşmalar için öneriler üretmekte kullanacağız.

Bu egzersiz, kursun bir parçasıdır

Python ile NLP için Özellik Mühendisliği

Kursa Göz Atın

Egzersiz talimatları

  • sklearn içinden TfidfVectorizer'ı içe aktar.
  • Bir TfidfVectorizer nesnesi oluştur. Adı vectorizer olsun.
  • fit_transform() metodunu kullanarak ted için tfidf_matrix üret.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Import TfidfVectorizer
from ____ import ____

# Create TfidfVectorizer object
____

# Generate matrix of word vectors
tfidf_matrix = vectorizer.____(____)

# Print the shape of tfidf_matrix
print(tfidf_matrix.shape)
Kodu Düzenle ve Çalıştır