or
Diese Übung ist Teil des Kurses
Zu Beginn des Kurses werden wir definieren, was Datenwissenschaft ist. Wir werden uns mit dem Arbeitsablauf in der Datenwissenschaft befassen und damit, wie die Datenwissenschaft auf reale Probleme angewendet wird. Zum Abschluss des Kapitels lernen wir die verschiedenen Rollen im Bereich der Datenwissenschaft kennen.
Nachdem wir nun den Arbeitsablauf der Datenwissenschaft kennen, tauchen wir tiefer in den ersten Schritt ein: das Sammeln und Speichern von Daten. Wir lernen die verschiedenen Datenquellen kennen, aus denen du schöpfen kannst, wie diese Daten aussehen, wie du die Daten nach der Erhebung speichern kannst und wie eine Daten-Pipeline den Prozess automatisieren kann.
Die Datenaufbereitung ist von grundlegender Bedeutung: Data Scientists verbringen 80 % ihrer Zeit mit dem Bereinigen und Manipulieren von Daten und nur 20 % der Zeit mit der eigentlichen Datenanalyse. In diesem Kapitel erfährst du, wie du Probleme in deinen Daten diagnostizieren und mit fehlenden Werten und Ausreißern umgehen kannst. Anschließend lernst du die Visualisierung kennen, ein weiteres wichtiges Werkzeug, um deine Daten zu erkunden und deine Ergebnisse zu vermitteln.
In diesem letzten Kapitel geht es um Experimente und Vorhersagen! Wir beginnen mit Experimenten, behandeln A/B-Tests und gehen dann zur Zeitreihenprognose über, wo wir lernen, wie man zukünftige Ereignisse vorhersagt. Zum Schluss befassen wir uns mit dem maschinellen Lernen, dem überwachten Lernen und dem Clustering.
Aktuelle Übung