LoslegenKostenlos loslegen

Anwendung von erweiterten Transformationen auf DataFrames

pandas verfügt über eine Fülle von eingebauten Transformationswerkzeugen, aber manchmal muss in einer Transformation eine erweiterte Logik verwendet werden. Mit der Funktion apply kannst du eine benutzerdefinierte Funktion auf eine Zeile oder Spalte eines DataFrames anwenden und so erweiterte Transformationen und die Erstellung von Merkmalen ermöglichen.

Die Funktion find_street_name() analysiert den Straßennamen aus "street_address" und lässt die Straßennummer aus der Zeichenkette weg. Diese Funktion wurde in den Speicher geladen und ist bereit, auf den raw_testing_scores DataFrame angewendet zu werden.

Diese Übung ist Teil des Kurses

ETL und ELT in Python

Kurs anzeigen

Anleitung zur Übung

  • In der Definition der Funktion transform() verwendest du die Funktion find_street_name(), um eine neue Spalte mit dem Namen "street_name" zu erstellen.
  • Verwende die Funktion transform(), um den raw_testing_scores DataFrame zu bereinigen.
  • Drucke den Kopf des cleaned_testing_scores DataFrame aus und beachte dabei die neue Spalte "street_name".

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

def transform(raw_data):
	# Use the apply function to extract the street_name from the street_address
    raw_data["street_name"] = raw_data.____(
   		# Pass the correct function to the apply method
        ____,
        axis=1
    )
    return raw_data

# Transform the raw_testing_scores DataFrame
cleaned_testing_scores = ____(raw_testing_scores)

# Print the head of the cleaned_testing_scores DataFrame
print(cleaned_testing_scores.____())
Code bearbeiten und ausführen