Vectorización de texto
Ahora transformarás la columna desc
del conjunto de datos UFO en vectores tf/idf, ya que es probable que podamos aprender algo de este campo.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones del ejercicio
- Imprime
.head()
de la columnadesc
. - Instanciar un objeto
TfidfVectorizer()
. - Ajusta y transforma la columna
desc
utilizandovec
. - Imprime la dirección
.shape
del vectordesc_tfidf
, para ver el número de columnas que ha creado.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Take a look at the head of the desc field
print(____)
# Instantiate the tfidf vectorizer object
vec = ____
# Fit and transform desc using vec
desc_tfidf = vec.____
# Look at the number of columns and rows
print(____.shape)