ComenzarEmpieza gratis

Vectores tf-idf para charlas TED

En este ejercicio, se te ha dado un corpus ted que contiene las transcripciones de 500 charlas TED. Tu tarea es generar los vectores tf-idf para estas charlas.

En una lección posterior, usaremos estos vectores para recomendar charlas similares basadas en la transcripción.

Este ejercicio forma parte del curso

Ingeniería de características para NLP en Python

Ver curso

Instrucciones del ejercicio

  • Importa TfidfVectorizer desde sklearn.
  • Crea un objeto TfidfVectorizer. Llámalo vectorizer.
  • Genera tfidf_matrix para ted usando el método fit_transform().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import TfidfVectorizer
from ____ import ____

# Create TfidfVectorizer object
____

# Generate matrix of word vectors
tfidf_matrix = vectorizer.____(____)

# Print the shape of tfidf_matrix
print(tfidf_matrix.shape)
Editar y ejecutar código