1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Procvičování statistických pohovorových otázek v Pythonu

Connected

cvičení

Identifikace odlehlých hodnot

Pokračujme s datasetem laptops a podívejme se na skryté odlehlé hodnoty. V tomto cvičení použijeme první techniku, kterou jsme probírali – identifikaci extrémních hodnot pomocí směrodatné odchylky – protože tato metoda je v praxi nejrozšířenější.

Vypočítáš popisné statistiky a hranice pro odlehlé hodnoty, pak najdeš řádky, které je obsahují, a odstraníš je z datasetu. Budeme pracovat hlavně se sloupcem Price.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Vypočítej průměr a směrodatnou odchylku sloupce Price.