Vectores tf-idf para charlas TED
En este ejercicio, se te ha dado un corpus ted que contiene las transcripciones de 500 charlas TED. Tu tarea es generar los vectores tf-idf para estas charlas.
En una lección posterior, usaremos estos vectores para recomendar charlas similares basadas en la transcripción.
Este ejercicio forma parte del curso
Ingeniería de características para NLP en Python
Instrucciones del ejercicio
- Importa
TfidfVectorizerdesdesklearn. - Crea un objeto
TfidfVectorizer. Llámalovectorizer. - Genera
tfidf_matrixparatedusando el métodofit_transform().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import TfidfVectorizer
from ____ import ____
# Create TfidfVectorizer object
____
# Generate matrix of word vectors
tfidf_matrix = vectorizer.____(____)
# Print the shape of tfidf_matrix
print(tfidf_matrix.shape)