Vektor tf-idf untuk TED Talk
Pada latihan ini, Anda diberikan sebuah korpus ted yang berisi transkrip dari 500 TED Talk. Tugas Anda adalah menghasilkan vektor tf-idf untuk talk tersebut.
Pada pelajaran selanjutnya, kita akan menggunakan vektor ini untuk membuat rekomendasi talk serupa berdasarkan transkripnya.
Latihan ini adalah bagian dari kursus
Rekayasa Fitur untuk NLP di Python
Petunjuk latihan
- Impor
TfidfVectorizerdarisklearn. - Buat objek
TfidfVectorizer. Beri namavectorizer. - Hasilkan
tfidf_matrixuntuktedmenggunakan metodefit_transform().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import TfidfVectorizer
from ____ import ____
# Create TfidfVectorizer object
____
# Generate matrix of word vectors
tfidf_matrix = vectorizer.____(____)
# Print the shape of tfidf_matrix
print(tfidf_matrix.shape)