1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wykrywanie anomalii w Pythonie

Connected

ćwiczenie

Wykrywanie wartości odstających za pomocą z-score

Rozkład normalny jest powszechny w przyrodzie i stanowi najczęściej spotykany typ rozkładu. Właśnie dlatego metoda z-score może być jedną z najszybszych metod wykrywania wartości odstających.

Przypomnij sobie regułę z lekcji: jeśli próbka jest oddalona od średniej o więcej niż trzy odchylenia standardowe, można ją uznać za wartość ekstremalną.

Pamiętaj jednak, że metodę z-score należy stosować z ostrożnością. Jest ona odpowiednia tylko wtedy, gdy mamy pewność, że dane pochodzą z rozkładu normalnego. W przeciwnym razie wyniki mogą być mylące.

Zmienna prices została już wczytana.

Instrukcje

100 XP
  • Zaimportuj funkcję zscore z odpowiedniego modułu scipy.
  • Oblicz z-score dla zmiennej prices i zapisz wyniki w zmiennej scores.
  • Utwórz maskę logiczną o nazwie is_over_3, która sprawdza, czy wartości bezwzględne z scores są większe niż 3.
  • Użyj maski, aby odfiltrować wartości odstające ze zmiennej prices.