ComenzarEmpieza gratis

Búsqueda de valores atípicos con tablas cruzadas

Ahora tienes que encontrar y eliminar los valores atípicos que sospechas que puede haber en los datos. Para este ejercicio, puedes utilizar tablas cruzadas y funciones agregadas.

Echa un vistazo a la columna person_emp_length. Ya has utilizado antes el argumento aggfunc = 'mean' para ver la media de una columna numérica, pero para detectar valores atípicos puedes utilizar otras funciones como min y max.

Puede que no sea posible que una persona tenga una duración de empleo inferior a 0 o superior a 60. Puedes utilizar tablas cruzadas para comprobar los datos y ver si hay algún caso así.

El conjunto de datos cr_loan se ha cargado en el espacio de trabajo.

Este ejercicio forma parte del curso

Modelado del riesgo crediticio en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create the cross table for loan status, home ownership, and the max employment length
print(pd.____(cr_loan[____],cr_loan[____],
        values=cr_loan[____], aggfunc=____))
Editar y ejecutar código