Verkennende data-analyse

Voordat je in de details van pipelines en preprocessing duikt, doen we eerst wat verkennende analyse op de oorspronkelijke, onbewerkte Ames housing dataset. In eerdere hoofdstukken hebben we deze data al voor je voorbewerkt zodat je je kon richten op de kernconcepten van XGBoost. In dit hoofdstuk doe je de preprocessing zelf!

Een kleinere versie van deze oorspronkelijke, onbewerkte gegevensset is alvast ingeladen in een pandas DataFrame met de naam df. Je taak is om df in de Shell te verkennen en de optie te kiezen die onjuist is. Het bredere doel van deze oefening is om te begrijpen welke transformaties je moet uitvoeren om XGBoost te kunnen gebruiken.

Deze oefening maakt deel uit van de cursus

Extreme Gradient Boosting met XGBoost

Bekijk cursus

Interactieve oefening met praktijkervaring

Zet theorie om in actie met een van onze interactieve oefeningen

Begin oefening