Deine Klassifizierungsdaten verstehen
Jetzt fängst du mit einem neuen Datensatz für ein Klassifizierungsproblem an. Diese Daten haben Infos über die Passagiere der Titanic. Du wirst Vorhersagefaktoren wie „ age
“ (Geschlecht des Passagiers) und „ fare
“ (Flugnummer) verwenden und anhand des Abflugorts jedes Passagiers vorhersagen, wer überleben wird. Diese Daten stammen aus einem Tutorial zu Datenwissenschaftswettbewerben. Hier findest du Beschreibungen der Funktionen.
Die Daten sind schon in einem pandas DataFrame namens „ df
“ geladen.
Es ist schlau, die Maximal- und Minimalwerte jeder Variablen zu überprüfen, um sicherzustellen, dass die Daten nicht falsch formatiert oder beschädigt sind. Wie alt durften die Passagiere auf der Titanic maximal sein? Verwende die Methode „ .describe()
“ in der IPython-Shell, um diese Frage zu beantworten.
Diese Übung ist Teil des Kurses
Einführung in Deep Learning mit Python
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
