Aplicar transformaciones avanzadas a DataFrames
pandas
tiene una plétora de herramientas de transformación incorporadas, pero a veces es necesario utilizar una lógica más avanzada en una transformación. La función apply
te permite aplicar una función definida por el usuario a una fila o columna de un DataFrame, abriendo la puerta a la transformación avanzada y a la generación de características.
La función find_street_name()
analiza el nombre de la calle a partir de "street_address"
, eliminando el número de la calle de la cadena. Esta función se ha cargado en la memoria y está lista para aplicarse al DataFrame raw_testing_scores
.
Este ejercicio forma parte del curso
ETL y ELT en Python
Instrucciones del ejercicio
- En la definición de la función
transform()
, utiliza la funciónfind_street_name()
para crear una nueva columna con el nombre"street_name"
. - Utiliza la función
transform()
para limpiar el DataFrameraw_testing_scores
. - Imprime la cabecera del DataFrame
cleaned_testing_scores
, observando la nueva columna"street_name"
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
def transform(raw_data):
# Use the apply function to extract the street_name from the street_address
raw_data["street_name"] = raw_data.____(
# Pass the correct function to the apply method
____,
axis=1
)
return raw_data
# Transform the raw_testing_scores DataFrame
cleaned_testing_scores = ____(raw_testing_scores)
# Print the head of the cleaned_testing_scores DataFrame
print(cleaned_testing_scores.____())