Aplicar transformaciones avanzadas a DataFrames
pandas tiene una plétora de herramientas de transformación incorporadas, pero a veces es necesario utilizar una lógica más avanzada en una transformación. La función apply te permite aplicar una función definida por el usuario a una fila o columna de un DataFrame, abriendo la puerta a la transformación avanzada y a la generación de características.
La función find_street_name() analiza el nombre de la calle a partir de "street_address", eliminando el número de la calle de la cadena. Esta función se ha cargado en la memoria y está lista para aplicarse al DataFrame raw_testing_scores.
Este ejercicio forma parte del curso
ETL y ELT en Python
Instrucciones del ejercicio
- En la definición de la función
transform(), utiliza la funciónfind_street_name()para crear una nueva columna con el nombre"street_name". - Utiliza la función
transform()para limpiar el DataFrameraw_testing_scores. - Imprime la cabecera del DataFrame
cleaned_testing_scores, observando la nueva columna"street_name".
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def transform(raw_data):
# Use the apply function to extract the street_name from the street_address
raw_data["street_name"] = raw_data.____(
# Pass the correct function to the apply method
____,
axis=1
)
return raw_data
# Transform the raw_testing_scores DataFrame
cleaned_testing_scores = ____(raw_testing_scores)
# Print the head of the cleaned_testing_scores DataFrame
print(cleaned_testing_scores.____())