ComeçarComece de graça

Vetorização de texto

Agora você vai transformar a coluna desc do conjunto de dados de avistamentos de OVNIs em vetores tf/idf, já que provavelmente há algo a aprender com esse campo.

Este exercício faz parte do curso

Pré-processamento para Machine Learning em Python

Ver curso

Instruções do exercício

  • Imprima o .head() da coluna desc.
  • Instancie um objeto TfidfVectorizer().
  • Faça o fit e transforme a coluna desc usando vec.
  • Imprima o .shape do vetor desc_tfidf para ver quantas colunas foram criadas.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Take a look at the head of the desc field
print(____)

# Instantiate the tfidf vectorizer object
vec = ____

# Fit and transform desc using vec
desc_tfidf = vec.____

# Look at the number of columns and rows
print(____.shape)
Editar e executar o código