Imputando valores ausentes com percentis
Neste exercício, você vai continuar praticando a imputação de valores ausentes. Diferente do exercício anterior, porém, você usará percentis em vez de médias para calcular as imputações. Usar percentis é uma ótima forma de obter imputações conservadoras. Imputar valores ausentes em uma coluna usando percentis envolve as seguintes etapas:
- Remover os valores ausentes da coluna de interesse.
- Em seguida, calcular, por exemplo, o 70º percentil dos números da coluna após remover os valores ausentes.
- O pior valor no 70º percentil depende da coluna da qual você calcula o percentil:
- Por exemplo, ter um grande montante de ativos é considerado bom, então um baixo montante de ativos é pior. O pior valor no 70º percentil de ativos é, na verdade, o 30º percentil de ativos.
- De forma análoga, grandes montantes de passivos são considerados ruins. Portanto, o pior valor no 70º percentil de passivos é simplesmente seu 70º percentil.
pandas foi carregado com o alias pd e NumPy foi carregado com o alias np. Um DataFrame do pandas chamado dataset já foi carregado para você. Ele tem a coluna "Total Current Liabilities", que contém alguns valores ausentes.
Este exercício faz parte do curso
Análise de Demonstrativos Financeiros em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Impute missing value with 70th percentile non-missing values of company
impute_by_company = ___
# Impute missing value with 70th percentile non-missing values of industry
impute_by_comp_type = ____
print(impute_by_company)
print(impute_by_comp_type)