1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ćwiczenie pytań rekrutacyjnych ze statystyki w Pythonie

Connected

Cvičení

Wrażliwość na wartości odstające

Analizując zależności między wieloma zmiennymi, korelacja to świetny punkt wyjścia. Jak jednak radzi sobie z bardziej wymagającymi zbiorami danych? Jak zachowuje się w obecności wartości odstających?

W tym ćwiczeniu zwizualizujesz i obliczysz korelację dla zbioru danych zawierającego wartość odstającą, a następnie ją usuniesz i sprawdzisz, co się zmieni. Na koniec ocenisz, jak dobrze korelacja sprawdza się w różnych sytuacjach, i wyciągniesz wnioski na temat tego, kiedy i gdzie warto jej używać.

Przykładowy zbiór danych z popularnego kwartetu Anscombe'a został zaimportowany jako zmienna df, wraz ze wszystkimi pakietami używanymi wcześniej w tym rozdziale.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Wyświetl wykres punktowy (matplotlib) dla cech X i Y; zwróć uwagę na wartość odstającą w prawym górnym rogu.