ComenzarEmpieza gratis

Imputación de valores faltantes con percentiles

En este ejercicio, seguirás practicando la imputación de valores faltantes. A diferencia del ejercicio anterior, aquí usarás percentiles en lugar de promedios para calcular las imputaciones. Usar percentiles es una forma estupenda de obtener imputaciones conservadoras. Imputar valores faltantes en una columna usando percentiles implica los siguientes pasos:

  • Elimina los valores faltantes de la columna de interés.
  • Luego calcula, por ejemplo, el percentil 70 de los números de la columna a la que le acabas de quitar los faltantes.
  • El «peor valor» en el percentil 70 depende de la columna sobre la que calcules el percentil:
    • Por ejemplo, tener muchos activos se considera algo positivo, así que una cantidad baja de activos es peor. El «peor valor» en el percentil 70 de activos es, en realidad, el percentil 30 de activos.
    • De forma análoga, una cantidad alta de pasivos se considera negativa. Así que el «peor valor» en el percentil 70 de pasivos es simplemente su percentil 70.

pandas se ha cargado con el alias pd y NumPy con el alias np. Tienes cargado un DataFrame de pandas llamado dataset. Incluye la columna "Total Current Liabilities", que tiene algunos valores faltantes.

Este ejercicio forma parte del curso

Análisis de estados financieros en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Impute missing value with 70th percentile non-missing values of company
impute_by_company = ___

# Impute missing value with 70th percentile non-missing values of industry
impute_by_comp_type = ____

print(impute_by_company)
print(impute_by_comp_type)
Editar y ejecutar código