1. Nauka
  2. /
  3. Kursy
  4. /
  5. Ćwiczenie pytań rekrutacyjnych z uczenia maszynowego w Pythonie

Connected

ćwiczenie

Wykrywanie wartości odstających

Bardzo ważnym aspektem poprawnego przetwarzania danych jest wykrywanie wartości odstających. W pytaniach rekrutacyjnych z uczenia maszynowego często pojawia się kwestia ich lokalizowania i obsługi. Jednym z najprostszych sposobów wykrycia wartości odstających jest wizualizacja graficzna.

Po znalezieniu i uzupełnieniu brakujących danych, kolejnym niezbędnym krokiem w przetwarzaniu wstępnym jest identyfikacja wartości odstających i decyzja, co z nimi zrobić.

Istnieje wiele bibliotek umożliwiających wizualizację wartości odstających. W tym ćwiczeniu użyjesz seaborn, aby narysować jednowymiarowe i wielowymiarowe wykresy pudełkowe dla wybranych kolumn zbioru loan_data.

Wszystkie niezbędne biblioteki zostały już zaimportowane.

Gdzie jesteś w potoku przetwarzania?

Machine learning pipeline

Instrukcje 1/3

undefined XP
  • 1
    • Utwórz jednowymiarowy wykres pudełkowy dla cechy Annual Income ze zbioru loan_data.
    • Utwórz wielowymiarowy wykres pudełkowy warunkowany zmienną Loan Status dla cechy Annual Income ze zbioru loan_data.
  • 2
    • Utwórz jednowymiarowy wykres pudełkowy dla cechy Monthly Debt ze zbioru loan_data.
    • Utwórz wielowymiarowy wykres pudełkowy warunkowany zmienną Loan Status dla cechy Monthly Debt ze zbioru loan_data.
  • 3
    • Utwórz jednowymiarowy wykres pudełkowy dla cechy Years of Credit History ze zbioru loan_data.
    • Utwórz wielowymiarowy wykres pudełkowy warunkowany zmienną Loan Status dla cechy Years of Credit History ze zbioru loan_data.