1. Nauka
  2. /
  3. Kursy
  4. /
  5. Skalowalne przetwarzanie danych w R

Connected

ćwiczenie

Wczytywanie surowych danych i przekształcanie ich w strukturę danych

Jak już wspomniano, jednym z powodów, dla których iotools działa tak szybko, jest rozdzielenie wczytywania danych z dysku od konwertowania danych binarnych na data.frame lub matrix. Dane w formacie binarnym są kopiowane z dysku do pamięci jako obiekty raw. Następnie te obiekty raw są przekazywane do zoptymalizowanych funkcji, które zamieniają je w obiekty data.frame lub matrix.

W tym ćwiczeniu nauczysz się rozdzielać wczytywanie danych z dysku (za pomocą funkcji readAsRaw()) od konwertowania surowych danych binarnych na matrix lub data.frame (za pomocą funkcji mstrsplit() i dstrsplit()).

Instrukcje

100 XP
  • Wczytaj plik "mortgage-sample.csv" jako surowy wektor.
  • Przekonwertuj zawartość surowego wektora na matrix liczb całkowitych.
  • Przekonwertuj zawartość surowego wektora na data.frame z 16 kolumnami całkowitoliczbowymi.