Vetorização de texto
Agora você vai transformar a coluna desc do conjunto de dados de avistamentos de OVNIs em vetores tf/idf, já que provavelmente há algo a aprender com esse campo.
Este exercício faz parte do curso
Pré-processamento para Machine Learning em Python
Instruções do exercício
- Imprima o
.head()da colunadesc. - Instancie um objeto
TfidfVectorizer(). - Faça o fit e transforme a coluna
descusandovec. - Imprima o
.shapedo vetordesc_tfidfpara ver quantas colunas foram criadas.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Take a look at the head of the desc field
print(____)
# Instantiate the tfidf vectorizer object
vec = ____
# Fit and transform desc using vec
desc_tfidf = vec.____
# Look at the number of columns and rows
print(____.shape)