MulaiMulai sekarang secara gratis

Vektor tf-idf untuk TED Talk

Pada latihan ini, Anda diberikan sebuah korpus ted yang berisi transkrip dari 500 TED Talk. Tugas Anda adalah menghasilkan vektor tf-idf untuk talk tersebut.

Pada pelajaran selanjutnya, kita akan menggunakan vektor ini untuk membuat rekomendasi talk serupa berdasarkan transkripnya.

Latihan ini adalah bagian dari kursus

Rekayasa Fitur untuk NLP di Python

Lihat Kursus

Petunjuk latihan

  • Impor TfidfVectorizer dari sklearn.
  • Buat objek TfidfVectorizer. Beri nama vectorizer.
  • Hasilkan tfidf_matrix untuk ted menggunakan metode fit_transform().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import TfidfVectorizer
from ____ import ____

# Create TfidfVectorizer object
____

# Generate matrix of word vectors
tfidf_matrix = vectorizer.____(____)

# Print the shape of tfidf_matrix
print(tfidf_matrix.shape)
Edit dan Jalankan Kode