1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Procvičování statistických pohovorových otázek v Pythonu

Connected

Cvičení

Průměr nebo medián

Jako datoví vědci se často snažíme popsat data co nejstručněji. To nás přivádí ke dvěma nejběžnějším mírám centrální tendence: průměru a mediánu. V tomto cvičení prozkoumáš několik různých scénářů a rozhodneš, která metrika je optimální pro efektivní popis dat.

Konkrétně budeš zkoumat australská meteorologická data obsahující příznaky související s teplotou a rychlostí větru. Tento dataset už je načtený jako weather a balíčky matplotlib a pandas jsou importované jako plt a pd — použiješ je i ve zbytku kapitoly.

Pokyny 1/3

undefined XP
  • 1

    Vykresli rozložení sloupce Temp3pm pomocí funkce hist() — jsou data nějak zkosená?

  • 2

    Přiřaď a vypiš průměr a medián pro sloupec Temp3pm — která hodnota podle tebe data lépe vystihuje?

  • 3

    Uprav kód tak, aby zkoumal jiný sloupec, a podívej se, jak vypadají výsledky pro Temp9am.