LoslegenKostenlos loslegen

Rohdaten einlesen und in eine Datenstruktur umwandeln

Wie bereits erwähnt, ist iotools unter anderem deshalb schnell, weil das Einlesen der Daten von der Festplatte vom Umwandeln der Binärdaten in ein data.frame oder eine matrix getrennt wird. Daten in ihrem Binärformat werden von der Festplatte in den Speicher als raw-Objekte kopiert. Diese raw-Objekte werden dann an optimierte Funktionen übergeben, die sie in data.frame- oder matrix-Objekte umwandeln.

In dieser Übung lernst du, wie du das Einlesen der Daten von der Festplatte (mit der Funktion readAsRaw()) trennst und anschließend die binären raw-Daten in eine matrix oder ein data.frame umwandelst (mit den Funktionen mstrsplit() und dstrsplit()).

Diese Übung ist Teil des Kurses

Skalierbare Datenverarbeitung in R

Kurs anzeigen

Anleitung zur Übung

  • Lies "mortgage-sample.csv" als Raw-Vektor ein.
  • Wandle den Inhalt des Raw-Vektors in eine matrix aus ganzen Zahlen um.
  • Wandle den Inhalt des Raw-Vektors in ein data.frame mit 16 Integer-Spalten um.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Read mortgage-sample.csv as a raw vector
raw_file_content <- ___("mortgage-sample.csv")

# Convert the raw vector contents to a matrix
mort_mat <- ___(___, sep = ",", type = ___, skip = 1)

# Look at the first 6 rows
head(mort_mat)

# Convert the raw file contents to a data.frame
mort_df <- ___(___, sep = ",", col_types = rep("integer", 16), skip = 1)

# Look at the first 6 rows
head(mort_df)
Code bearbeiten und ausführen