1. Nauka
  2. /
  3. Kursy
  4. /
  5. Sprawne importowanie danych z pandas

Connected

ćwiczenie

Wybieranie kolumn za pomocą SQL

Zbiory danych często zawierają kolumny, które nie są potrzebne do analizy – tak jest na przykład z tabelą weather w bazie data.db. Niektóre z nich są nadmiarowe (np. wysokość nad poziomem morza, skoro wszystkie obserwacje pochodzą z tego samego miejsca), a inne zawierają zmienne, które nas nie interesują. Po utworzeniu silnika bazy danych napiszesz zapytanie SELECT, które pobierze tylko kolumny z datą i temperaturą, a następnie przekażesz je do read_sql(), aby uzyskać ramkę danych z wartościami maksymalnych i minimalnych temperatur.

pandas jest wczytany jako pd, a create_engine() zostało zaimportowane z sqlalchemy.

Uwaga: Sprawdzarka SQL jest dość restrykcyjna co do kolejności kolumn – pola muszą być wybrane w podanej kolejności.

Instrukcje

100 XP
  • Utwórz silnik bazy danych dla data.db.
  • Napisz zapytanie SQL, które wybiera kolumny date, tmax i tmin z tabeli weather za pomocą SELECT.
  • Utwórz ramkę danych, przekazując zapytanie i silnik do read_sql(), a wynik przypisz do zmiennej temperatures.