Modelagem do conjunto de dados UFO, parte 2
Por fim, você criará um modelo usando o vetor de texto que criamos, desc_tfidf
, usando a lista filtered_words
para criar um vetor de texto filtrado. Vamos ver se você consegue prever o type
do avistamento com base no texto. Você usará um modelo Naive Bayes para isso.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções de exercício
- Filtre o vetor
desc_tfidf
passando uma lista defiltered_words
para o índice. - Divida os recursos
filtered_text
ey
, garantindo uma distribuição de classe igual nos conjuntos de treinamento e teste; use umrandom_state
de42
. - Use o
.fit()
do modelonb
para ajustar oX_train
e oy_train
. - Imprima o
.score()
do modelonb
nos conjuntosX_test
ey_test
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Use the list of filtered words we created to filter the text vector
filtered_text = ____[:, list(____)]
# Split the X and y sets using train_test_split, setting stratify=y
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, ____, random_state=42)
# Fit nb to the training sets
____
# Print the score of nb on the test sets
____