Vetorização de texto
Agora você transformará a coluna desc
no conjunto de dados UFO em vetores tf/idf, pois é provável que haja algo que possamos aprender com esse campo.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções de exercício
- Imprima o endereço
.head()
da colunadesc
. - Instanciar um objeto
TfidfVectorizer()
. - Ajuste e transforme a coluna
desc
usandovec
. - Imprima o endereço
.shape
do vetordesc_tfidf
para ver o número de colunas criadas.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Take a look at the head of the desc field
print(____)
# Instantiate the tfidf vectorizer object
vec = ____
# Fit and transform desc using vec
desc_tfidf = vec.____
# Look at the number of columns and rows
print(____.shape)