1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza sprawozdań finansowych w Pythonie

Connected

ćwiczenie

Imputacja brakujących wartości za pomocą percentyli

W tym ćwiczeniu będziesz dalej ćwiczyć imputację brakujących wartości. W odróżnieniu od poprzedniego ćwiczenia, zamiast średnich użyjesz percentyli. To świetny sposób na uzyskanie konserwatywnych imputacji. Imputacja brakujących wartości w kolumnie za pomocą percentyli przebiega następująco:

  • Usuń brakujące wartości z interesującej cię kolumny.
  • Oblicz, na przykład, 70. percentyl wartości z kolumny, z której właśnie usunięto braki.
  • Wartość 70. percentyla „najgorszego przypadku" zależy od kolumny, dla której obliczasz percentyl:
    • Na przykład duże aktywa uważa się za coś korzystnego, więc niska wartość aktywów jest gorsza. 70. percentyl najgorszego przypadku dla aktywów to w praktyce 30. percentyl aktywów.
    • Analogicznie, wysokie zobowiązania są niekorzystne. Dlatego 70. percentyl najgorszego przypadku dla zobowiązań to po prostu ich 70. percentyl.

biblioteka pandas została wczytana z aliasem pd, a NumPy z aliasem np. Wczytano dla ciebie ramkę danych pandas o nazwie dataset. Zawiera ona kolumnę "Total Current Liabilities", w której znajdują się pewne brakujące wartości.

Instrukcje 1/2

undefined XP
    1
    2
  • Dokonaj imputacji brakujących wartości w kolumnie "Total Current Liabilities" według "company", używając 70. percentyla wartości nieujemnych.
  • Dokonaj imputacji brakujących wartości w kolumnie "Total Current Liabilities" według "comp_type", używając 70. percentyla wartości nieujemnych.