Vetorização de texto
Agora você transformará a coluna desc no conjunto de dados UFO em vetores tf/idf, pois é provável que haja algo que possamos aprender com esse campo.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções do exercício
- Imprima o endereço
.head()da colunadesc. - Instanciar um objeto
TfidfVectorizer(). - Ajuste e transforme a coluna
descusandovec. - Imprima o endereço
.shapedo vetordesc_tfidfpara ver o número de colunas criadas.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Take a look at the head of the desc field
print(____)
# Instantiate the tfidf vectorizer object
vec = ____
# Fit and transform desc using vec
desc_tfidf = vec.____
# Look at the number of columns and rows
print(____.shape)