ComeçarComece gratuitamente

Vetorização de texto

Agora você transformará a coluna desc no conjunto de dados UFO em vetores tf/idf, pois é provável que haja algo que possamos aprender com esse campo.

Este exercício faz parte do curso

Pré-processamento para aprendizado de máquina em Python

Ver Curso

Instruções de exercício

  • Imprima o endereço .head() da coluna desc.
  • Instanciar um objeto TfidfVectorizer().
  • Ajuste e transforme a coluna desc usando vec.
  • Imprima o endereço .shape do vetor desc_tfidf para ver o número de colunas criadas.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Take a look at the head of the desc field
print(____)

# Instantiate the tfidf vectorizer object
vec = ____

# Fit and transform desc using vec
desc_tfidf = vec.____

# Look at the number of columns and rows
print(____.shape)
Editar e executar código