1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Streamlined Data Ingestion with pandas

Connected

Cvičení

Výběr sloupců pomocí SQL

Datové sady někdy obsahují sloupce, které pro analýzu nepotřebuješ – tak je to i s tabulkou weather v data.db. Některé sloupce jsou nadbytečné, například nadmořská výška, protože všechna měření probíhala na stejném místě. Jiné zase obsahují proměnné, které tě nezajímají. Až vytvoříš databázový engine, napíšeš dotaz, který pomocí SELECT vybere pouze sloupce s datem a teplotou, a oba předáš funkci read_sql(), aby vznikl dataframe s hodnotami maximálních a minimálních teplot.

pandas je načtený jako pd a create_engine() je importovaný z sqlalchemy.

Poznámka: SQL checker je poměrně přísný, pokud jde o pořadí sloupců – pole musí být vybraná v uvedeném pořadí.

Pokyny

100 XP
  • Vytvoř databázový engine pro data.db.
  • Napiš SQL dotaz, který pomocí SELECT vybere sloupce date, tmax a tmin z tabulky weather.
  • Vytvoř dataframe tak, že dotaz a engine předáš funkci read_sql(), a výsledný dataframe přiřaď do proměnné temperatures.