Anwendung von erweiterten Transformationen auf DataFrames
pandas
verfügt über eine Fülle von eingebauten Transformationswerkzeugen, aber manchmal muss in einer Transformation eine erweiterte Logik verwendet werden. Mit der Funktion apply
kannst du eine benutzerdefinierte Funktion auf eine Zeile oder Spalte eines DataFrames anwenden und so erweiterte Transformationen und die Erstellung von Merkmalen ermöglichen.
Die Funktion find_street_name()
analysiert den Straßennamen aus "street_address"
und lässt die Straßennummer aus der Zeichenkette weg. Diese Funktion wurde in den Speicher geladen und ist bereit, auf den raw_testing_scores
DataFrame angewendet zu werden.
Diese Übung ist Teil des Kurses
ETL und ELT in Python
Anleitung zur Übung
- In der Definition der Funktion
transform()
verwendest du die Funktionfind_street_name()
, um eine neue Spalte mit dem Namen"street_name"
zu erstellen. - Verwende die Funktion
transform()
, um denraw_testing_scores
DataFrame zu bereinigen. - Drucke den Kopf des
cleaned_testing_scores
DataFrame aus und beachte dabei die neue Spalte"street_name"
.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
def transform(raw_data):
# Use the apply function to extract the street_name from the street_address
raw_data["street_name"] = raw_data.____(
# Pass the correct function to the apply method
____,
axis=1
)
return raw_data
# Transform the raw_testing_scores DataFrame
cleaned_testing_scores = ____(raw_testing_scores)
# Print the head of the cleaned_testing_scores DataFrame
print(cleaned_testing_scores.____())