Búsqueda de valores atípicos con tablas cruzadas
Ahora tienes que encontrar y eliminar los valores atípicos que sospechas que puede haber en los datos. Para este ejercicio, puedes utilizar tablas cruzadas y funciones agregadas.
Echa un vistazo a la columna person_emp_length
. Ya has utilizado antes el argumento aggfunc = 'mean'
para ver la media de una columna numérica, pero para detectar valores atípicos puedes utilizar otras funciones como min
y max
.
Puede que no sea posible que una persona tenga una duración de empleo inferior a 0 o superior a 60. Puedes utilizar tablas cruzadas para comprobar los datos y ver si hay algún caso así.
El conjunto de datos cr_loan
se ha cargado en el espacio de trabajo.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create the cross table for loan status, home ownership, and the max employment length
print(pd.____(cr_loan[____],cr_loan[____],
values=cr_loan[____], aggfunc=____))