Je classificatiedata begrijpen
Nu ga je modelleren met een nieuwe gegevensset voor een classificatieprobleem. Deze data bevat informatie over passagiers van de Titanic. Je gebruikt voorspellers zoals age, fare en de plek waar elke passagier aan boord is gegaan om te voorspellen wie zou overleven. Deze data komt uit een tutorial over data science-wedstrijden. Kijk hier voor beschrijvingen van de features.
De data is al ingeladen in een pandas DataFrame genaamd df.
Het is slim om de maximum- en minimumwaarden van elke variabele te bekijken om te controleren of de data niet verkeerd is opgemaakt of beschadigd. Wat was de maximale leeftijd van passagiers op de Titanic? Gebruik de methode .describe() in de IPython Shell om deze vraag te beantwoorden.
Deze oefening maakt deel uit van de cursus
Introductie tot Deep Learning in Python
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen