ComenzarEmpieza gratis

¿Cómo está la integridad de nuestros datos?

Se han fusionado nuevos datos en el DataFrame banking que contiene detalles sobre cómo se distribuyen las inversiones en la columna inv_amount entre cuatro fondos diferentes A, B, C y D.

Además, la edad y la fecha de nacimiento de los clientes se almacenan ahora en las columnas age y birth_date respectivamente.

Quieres entender cómo invierten los clientes de distintos grupos de edad. Sin embargo, primero debes asegurarte de que los datos que analizas son correctos. Lo harás cotejando los valores de inv_amount y age con la cantidad invertida en los distintos fondos y las fechas de nacimiento de los clientes. Tanto pandas como datetime se han importado como pd y dt respectivamente.

Este ejercicio forma parte del curso

Limpieza de datos en Python

Ver curso

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Store fund columns to sum against
fund_columns = ['fund_A', 'fund_B', 'fund_C', 'fund_D']

# Find rows where fund_columns row sum == inv_amount
inv_equ = banking[____].____(____) == ____

# Store consistent and inconsistent data
consistent_inv = ____[____]
inconsistent_inv = ____[____]

# Store consistent and inconsistent data
print("Number of inconsistent investments: ", inconsistent_inv.shape[0])
Editar y ejecutar código