Búsqueda de valores atípicos con tablas cruzadas
Ahora tienes que encontrar y eliminar los valores atípicos que sospechas que puede haber en los datos. Para este ejercicio, puedes utilizar tablas cruzadas y funciones agregadas.
Echa un vistazo a la columna person_emp_length. Ya has utilizado antes el argumento aggfunc = 'mean' para ver la media de una columna numérica, pero para detectar valores atípicos puedes utilizar otras funciones como min y max.
Puede que no sea posible que una persona tenga una duración de empleo inferior a 0 o superior a 60. Puedes utilizar tablas cruzadas para comprobar los datos y ver si hay algún caso así.
El conjunto de datos cr_loan se ha cargado en el espacio de trabajo.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create the cross table for loan status, home ownership, and the max employment length
print(pd.____(cr_loan[____],cr_loan[____],
values=cr_loan[____], aggfunc=____))