1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ensemble Methods in Python

Connected

cvičení

Průzkum dat UCI SECOM

Na závěr této kapitoly si upevníš pochopení baggingu na novém datasetu! Tato data pocházejí z výrobního procesu polovodičů a jsou dostupná z repozitáře UCI Machine Learning Repository.

Každý řádek představuje jednu výrobní položku. Příznaky jsou měření ze senzorů nebo z různých bodů výrobního procesu. Štítky říkají, zda daná položka testem prošla (1), nebo neprošla (-1).

Dataset je načtený a dostupný jako uci_secom. Proměnná target odpovídá sloupci 'Pass/Fail'. Prozkoumej ji pomocí metod .value_counts() a .describe(). Co si všimneš?

Pokyny

50 XP

Možné odpovědi