Appliquer des transformations avancées aux DataFrame
pandas
dispose d'une pléthore d'outils de transformation intégrés, mais il est parfois nécessaire d'utiliser une logique plus avancée dans une transformation. La fonction apply
vous permet d'appliquer une fonction définie par l'utilisateur à une ligne ou à une colonne d'un DataFrame, ouvrant ainsi la voie à des transformations avancées et à la génération de caractéristiques.
La fonction find_street_name()
analyse le nom de la rue à partir de "street_address"
, en supprimant le numéro de la rue de la chaîne. Cette fonction a été chargée en mémoire et est prête à être appliquée au DataFrame raw_testing_scores
.
Cet exercice fait partie du cours
ETL et ELT en Python
Instructions
- Dans la définition de la fonction
transform()
, utilisez la fonctionfind_street_name()
pour créer une nouvelle colonne appelée"street_name"
. - Utilisez la fonction
transform()
pour nettoyer le DataFrameraw_testing_scores
. - Imprimez la tête du DataFrame
cleaned_testing_scores
, en observant la nouvelle colonne"street_name"
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
def transform(raw_data):
# Use the apply function to extract the street_name from the street_address
raw_data["street_name"] = raw_data.____(
# Pass the correct function to the apply method
____,
axis=1
)
return raw_data
# Transform the raw_testing_scores DataFrame
cleaned_testing_scores = ____(raw_testing_scores)
# Print the head of the cleaned_testing_scores DataFrame
print(cleaned_testing_scores.____())