Imputar dados ausentes
Você descobriu que as colunas "price" e "building_id" têm valores ausentes no conjunto de dados Rental Listing Inquiries. Então, antes de passar os dados para os modelos, você precisa imputar esses valores.
A feature numérica "price" será codificada com o valor médio dos preços não ausentes.
Imputar a feature categórica "building_id" com a categoria mais frequente é uma má ideia, porque isso significaria que todos os apartamentos com "building_id" ausente estão localizados no prédio mais popular. A melhor opção é imputar com uma nova categoria.
O DataFrame rental_listings com os dados da competição já foi lido para você.
Este exercício faz parte do curso
Vencendo uma competição do Kaggle em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import SimpleImputer
from sklearn.impute import SimpleImputer
# Create mean imputer
mean_imputer = ____(strategy='____')
# Price imputation
rental_listings[['price']] = mean_imputer.____(____[[____]])