or
Diese Übung ist Teil des Kurses
In diesem Kapitel lernst du, was Feature Engineering ist und wie du damit bei realen Daten loslegst. Du lädst, erkundest und visualisierst einen Datensatz mit Umfrageantworten und lernst dabei die zugrunde liegenden Datentypen kennen und warum sie beeinflussen, wie du deine Features entwickeln solltest. Mit dem Paket pandas erstellst du neue Features aus kategorialen und kontinuierlichen Spalten.
Dieses Kapitel führt dich in die Realität unordentlicher und unvollständiger Daten ein. Du lernst, fehlende Werte in deinen Daten zu finden, und erkundest verschiedene Ansätze, wie du damit umgehst. Außerdem nutzt du String-Manipulationstechniken, um unerwünschte Zeichen in deinem Datensatz zu bereinigen.
In diesem Kapitel konzentrierst du dich auf die Analyse der zugrunde liegenden Verteilung deiner Daten und darauf, ob sie sich auf deine Machine-Learning-Pipeline auswirkt. Du lernst, wie du mit schief verteilten Daten umgehst und mit Situationen, in denen Ausreißer deine Analyse negativ beeinflussen könnten.
Zum Schluss arbeitest du in diesem Kapitel mit unstrukturierten Textdaten und lernst, wie du daraus spaltenweise Features erzeugen kannst. Du vergleichst, wie sich unterschiedliche Ansätze darauf auswirken, wie viel Kontext aus einem Text extrahiert wird, und wie du den Bedarf an Kontext mit der Anzahl der erzeugten Features in Einklang bringst.
Aktuelle Übung