CommencerCommencer gratuitement

Appliquer des transformations avancées aux DataFrame

pandas dispose d'une pléthore d'outils de transformation intégrés, mais il est parfois nécessaire d'utiliser une logique plus avancée dans une transformation. La fonction apply vous permet d'appliquer une fonction définie par l'utilisateur à une ligne ou à une colonne d'un DataFrame, ouvrant ainsi la voie à des transformations avancées et à la génération de caractéristiques.

La fonction find_street_name() analyse le nom de la rue à partir de "street_address", en supprimant le numéro de la rue de la chaîne. Cette fonction a été chargée en mémoire et est prête à être appliquée au DataFrame raw_testing_scores.

Cet exercice fait partie du cours

ETL et ELT en Python

Afficher le cours

Instructions

  • Dans la définition de la fonction transform(), utilisez la fonction find_street_name() pour créer une nouvelle colonne appelée "street_name".
  • Utilisez la fonction transform() pour nettoyer le DataFrame raw_testing_scores.
  • Imprimez la tête du DataFrame cleaned_testing_scores, en observant la nouvelle colonne "street_name".

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

def transform(raw_data):
	# Use the apply function to extract the street_name from the street_address
    raw_data["street_name"] = raw_data.____(
   		# Pass the correct function to the apply method
        ____,
        axis=1
    )
    return raw_data

# Transform the raw_testing_scores DataFrame
cleaned_testing_scores = ____(raw_testing_scores)

# Print the head of the cleaned_testing_scores DataFrame
print(cleaned_testing_scores.____())
Modifier et exécuter le code