1. Nauka
  2. /
  3. Kursy
  4. /
  5. Sprawne importowanie danych z pandas

Connected

ćwiczenie

Łączenie tabel

Tabele w relacyjnych bazach danych mają zazwyczaj kolumny kluczowe z unikalnymi identyfikatorami rekordów. Dzięki temu można budować pipeline'y łączące tabele za pomocą operacji JOIN w SQL – zamiast łączyć dane dopiero po ich zaimportowaniu.

Rekordy w tabeli hpd311calls często dotyczą problemów, takich jak wycieki czy awarie ogrzewania, które nasilają się w określonych warunkach pogodowych. W tym ćwiczeniu złączysz dane pogodowe (weather) z rekordami zgłoszeń po wspólnych kolumnach dat, aby uzyskać wszystko w jednej ramce danych. Możesz założyć, że te kolumny mają ten sam typ danych.

pandas jest załadowany jako pd, a silnik bazy danych engine został już utworzony.

Uwaga: Sprawdzarka SQL jest wrażliwa na kolejność tabel w złączeniu – oczekuje konkretnych tabel po lewej i prawej stronie.

Instrukcje

100 XP
  • Uzupełnij zapytanie, aby złączyć tabelę weather z tabelą hpd311calls po kolumnach date i created_date.
  • Wykonaj zapytanie do bazy danych i przypisz wynikową ramkę danych do zmiennej calls_with_weather.
  • Wyświetl pierwsze kilka wierszy calls_with_weather, aby potwierdzić, że wszystkie kolumny zostały poprawnie złączone.