Verkennende data-analyse
Voordat je in de details van pipelines en preprocessing duikt, doen we eerst wat verkennende analyse op de oorspronkelijke, onbewerkte Ames housing dataset. In eerdere hoofdstukken hebben we deze data al voor je voorbewerkt zodat je je kon richten op de kernconcepten van XGBoost. In dit hoofdstuk doe je de preprocessing zelf!
Een kleinere versie van deze oorspronkelijke, onbewerkte gegevensset is alvast ingeladen in een pandas DataFrame met de naam df. Je taak is om df in de Shell te verkennen en de optie te kiezen die onjuist is. Het bredere doel van deze oefening is om te begrijpen welke transformaties je moet uitvoeren om XGBoost te kunnen gebruiken.
Deze oefening maakt deel uit van de cursus
Extreme Gradient Boosting met XGBoost
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen