ComenzarEmpieza gratis

Vectorización de texto

Ahora transformarás la columna desc del conjunto de datos UFO en vectores tf/idf, ya que es probable que podamos aprender algo de este campo.

Este ejercicio forma parte del curso

Preprocesamiento para machine learning en Python

Ver curso

Instrucciones del ejercicio

  • Imprime .head() de la columna desc.
  • Instanciar un objeto TfidfVectorizer().
  • Ajusta y transforma la columna desc utilizando vec.
  • Imprime la dirección .shape del vector desc_tfidf, para ver el número de columnas que ha creado.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Take a look at the head of the desc field
print(____)

# Instantiate the tfidf vectorizer object
vec = ____

# Fit and transform desc using vec
desc_tfidf = vec.____

# Look at the number of columns and rows
print(____.shape)
Editar y ejecutar código