1. Nauka
  2. /
  3. Kursy
  4. /
  5. ETL i ELT w Pythonie

Connected

ćwiczenie

Stosowanie zaawansowanych transformacji do DataFrames

pandas oferuje wiele wbudowanych narzędzi do transformacji danych, ale czasem potrzebna jest bardziej zaawansowana logika. Funkcja apply pozwala zastosować funkcję zdefiniowaną przez użytkownika do wiersza lub kolumny DataFrame, otwierając drzwi do zaawansowanych transformacji i generowania cech.

Funkcja find_street_name() wyodrębnia nazwę ulicy z kolumny "street_address", usuwając numer z ciągu znaków. Funkcja ta została załadowana do pamięci i jest gotowa do zastosowania na DataFrame raw_testing_scores.

Instrukcje

100 XP
  • W definicji funkcji transform() użyj funkcji find_street_name(), aby utworzyć nową kolumnę o nazwie "street_name".
  • Użyj funkcji transform(), aby oczyścić DataFrame raw_testing_scores.
  • Wyświetl pierwsze wiersze DataFrame cleaned_testing_scores i zwróć uwagę na nową kolumnę "street_name".