Aplicar transformaciones avanzadas a DataFrames
pandas tiene un sinfín de herramientas de transformación integradas, pero a veces hace falta lógica más avanzada en una transformación. La función apply te permite aplicar una función definida por el usuario a una fila o columna de un DataFrame, lo que abre la puerta a transformaciones avanzadas y a la generación de características.
La función find_street_name() extrae el nombre de la calle de "street_address", eliminando el número de la calle de la cadena. Esta función ya se ha cargado en memoria y está lista para aplicarse al DataFrame raw_testing_scores.
Este ejercicio forma parte del curso
ETL and ELT con Python
Instrucciones del ejercicio
- En la definición de la función
transform(), usa la funciónfind_street_name()para crear una nueva columna llamada"street_name". - Usa la función
transform()para limpiar el DataFrameraw_testing_scores. - Imprime el head del DataFrame
cleaned_testing_scoresy observa la nueva columna"street_name".
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def transform(raw_data):
# Use the apply function to extract the street_name from the street_address
raw_data["street_name"] = raw_data.____(
# Pass the correct function to the apply method
____,
axis=1
)
return raw_data
# Transform the raw_testing_scores DataFrame
cleaned_testing_scores = ____(raw_testing_scores)
# Print the head of the cleaned_testing_scores DataFrame
print(cleaned_testing_scores.____())