Faktorisieren, Runde zwei
In der letzten Übung hast du gelernt, wie man eine Datendatei mit dem Befehl read_sav() importiert. Bei SPSS-Datendateien kann es auch vorkommen, dass einige der importierten Variablen die Klasse labelled haben. Das dient dazu, alle ursprünglich in den .sav- und .por-Dateien vorhandenen Beschriftungsinformationen zu erhalten. Es wird empfohlen, diese Variablen in Faktoren oder andere Standardklassen von R zu überführen (also zu ändern).
Die Daten für diese Übung enthalten Informationen zu Mitarbeitenden sowie deren demografischen und wirtschaftlichen Merkmalen (Quelle: QRiE). Die Daten findest du unter folgender URL:
https://assets.datacamp.com/production/course_1478/datasets/employee.sav
Diese Übung ist Teil des Kurses
Fortgeschrittenes Importieren von Daten in R
Anleitung zur Übung
- Importiere die SPSS-Daten direkt von der URL und speichere das resultierende Data Frame als
work. - Zeige die Zusammenfassung der Spalte
GENDERvonworkan. Diese Information ist nicht besonders hilfreich, oder? - Wandle die Spalte
GENDERinworkin einen Faktor um, die Klasse für kategoriale Variablen in R. Verwendeas_factor(). - Zeige erneut die Zusammenfassung der Spalte
GENDERan. Dieses Mal ergibt die Ausgabe viel mehr Sinn.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# haven is already loaded
# Import SPSS data from the URL: work
# Display summary of work$GENDER
# Convert work$GENDER to a factor
# Display summary of work$GENDER again