1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Streamlined Data Ingestion with pandas

Connected

cvičení

Spojování, filtrování a agregace

V tomto cvičení využiješ vše, co ses naučil/a, a sestavíš datovou sadu, která ti pomůže zjistit, jak počet stížností na vytápění podaných na linku 311 v New Yorku souvisí s teplotou.

Kromě tabulky hpd311calls obsahuje data.db také tabulku weather s denními hodnotami maximálních a minimálních teplot pro New York. Cílem je získat denní počty volání týkajících se tepla a teplé vody spolu s teplotními daty. Tohle vše zvládneme jedním dotazem, který sestavíme po částech.

V první části získáme pouze ta data, která nás zajímají, z tabulky hpd311calls. Ve druhé části pak dotaz upravíme tak, aby zahrnoval i data z tabulky weather.

pandas je importován jako pd a databázový engine je k dispozici jako engine.

Pokyny 1/2

undefined XP
    1
    2
  • Dokonči dotaz tak, aby vrátil sloupec created_date a počty záznamů, jejichž complaint_type je HEAT/HOT WATER, z tabulky hpd311calls seskupené podle data.
  • Vytvoř dataframe df s výsledky dotazu.