BaşlayınÜcretsiz Başlayın

TED konuşmaları için tf-idf vektörleri

Bu egzersizde, 500 TED Konuşmasının dökümlerini içeren ted adlı bir korpus verildi. Görevin bu konuşmalar için tf-idf vektörlerini üretmek.

İlerideki bir derste, bu vektörleri döküme dayalı benzer konuşmalar için öneriler üretmekte kullanacağız.

Bu egzersiz

Python ile NLP için Özellik Mühendisliği

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • sklearn içinden TfidfVectorizer'ı içe aktar.
  • Bir TfidfVectorizer nesnesi oluştur. Adı vectorizer olsun.
  • fit_transform() metodunu kullanarak ted için tfidf_matrix üret.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import TfidfVectorizer
from ____ import ____

# Create TfidfVectorizer object
____

# Generate matrix of word vectors
tfidf_matrix = vectorizer.____(____)

# Print the shape of tfidf_matrix
print(tfidf_matrix.shape)
Kodu Düzenle ve Çalıştır