1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Procvičování statistických pohovorových otázek v Pythonu

Connected

Cvičení

Citlivost na odlehlé hodnoty

Při analýze vztahu mezi více proměnnými je korelace skvělým výchozím bodem. Ale jak si poradí s některými zajímavějšími datovými sadami? Jak odolná je vůči odlehlým hodnotám?

V tomto cvičení sestavíš graf a vypočítáš korelaci pro datovou sadu obsahující odlehlou hodnotu, pak ji odstraníš a uvidíš, co se změní. Cílem je zjistit, jak korelace funguje, a dojít k závěru o tom, kdy a kde ji používat.

Ukázková datová sada z proslulého Anscombeho kvartetu je pro tebe připravena v proměnné df, spolu se všemi balíčky použitými dříve v této kapitole.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Zobraz bodový graf (matplotlib) příznaků X a Y a všimni si odlehlé hodnoty v pravém horním rohu.