LoslegenKostenlos loslegen

Erweiterte Transformationen auf DataFrames anwenden

pandas verfügt über eine Fülle von eingebauten Transformationswerkzeugen, aber manchmal muss in einer Transformation eine fortgeschrittenere Logik verwendet werden. Mit der Funktion apply kannst du eine benutzerdefinierte Funktion auf eine Zeile oder Spalte eines DataFrame anwenden und so die Tür für fortschrittliche Transformationen und die Erstellung von Features öffnen.

Die Funktion find_street_name() analysiert den Straßennamen aus "street_address" und lässt die Straßennummer aus der Zeichenkette weg. Diese Funktion wurde in den Speicher geladen und kann auf den raw_testing_scores DataFrame angewendet werden.

Diese Übung ist Teil des Kurses

ETL und ELT in Python

Kurs anzeigen

Anleitung zur Übung

  • In der Definition der Funktion transform() verwendest du die Funktion find_street_name(), um eine neue Spalte mit dem Namen "street_name" zu erstellen.
  • Verwende die Funktion transform(), um den raw_testing_scores DataFrame zu bereinigen.
  • Drucke den Kopf des cleaned_testing_scores DataFrame und beachte dabei die neue Spalte "street_name".

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

def transform(raw_data):
	# Use the apply function to extract the street_name from the street_address
    raw_data["street_name"] = raw_data.____(
   		# Pass the correct function to the apply method
        ____,
        axis=1
    )
    return raw_data

# Transform the raw_testing_scores DataFrame
cleaned_testing_scores = ____(raw_testing_scores)

# Print the head of the cleaned_testing_scores DataFrame
print(cleaned_testing_scores.____())
Code bearbeiten und ausführen