Diese Übung ist Teil des Kurses
Zu Beginn des Kurses werden wir definieren, was Data Science ist. Wir werden uns mit dem Arbeitsablauf in der Data Science befassen und damit, wie Data Science auf reale Probleme angewendet wird. Zum Abschluss des Kapitels lernen wir die verschiedenen Rollen im Bereich der Data Science kennen.
Aktuelle Übung
Nachdem wir nun den Arbeitsablauf der Data Science kennen, tauchen wir tiefer in den ersten Schritt ein: das Sammeln und Speichern von Daten. Wir lernen die verschiedenen Datenquellen kennen, aus denen du schöpfen kannst, wie diese Daten aussehen, wie du die Daten nach der Erhebung speichern kannst und wie eine Daten-Pipeline den Prozess automatisieren kann.
Die Datenaufbereitung ist von grundlegender Bedeutung: Data Scientists verbringen 80 % ihrer Zeit mit dem Bereinigen und Manipulieren von Daten und nur 20 % der Zeit mit der eigentlichen Datenanalyse. In diesem Kapitel erfährst du, wie du Probleme in deinen Daten diagnostizieren und mit fehlenden Werten und Ausreißern umgehen kannst. Anschließend lernst du die Visualisierung kennen, ein weiteres wichtiges Werkzeug, um deine Daten zu erkunden und deine Ergebnisse zu vermitteln.
In diesem letzten Kapitel geht es um Experimente und Vorhersagen! Wir beginnen mit Experimenten, behandeln A/B-Tests und gehen dann zur Zeitreihenprognose über, wo wir lernen, wie man zukünftige Ereignisse vorhersagt. Zum Schluss befassen wir uns mit dem maschinellen Lernen, dem überwachten Lernen und dem Clustering.