1. Nauka
  2. /
  3. Kursy
  4. /
  5. Skalowalne przetwarzanie danych w R

Connected

ćwiczenie

Wczytywanie fragmentów jako data.frame

W poprzednim przykładzie każdy fragment był wczytywany do funkcji przetwarzającej jako macierz za pomocą mstrsplit(). To podejście sprawdza się, gdy dane mają prostokątną strukturę i każda kolumna zawiera elementy tego samego typu. Jeśli typy są różne, warto wczytać dane jako data.frame. Można to zrobić, konwertując macierz na ramkę danych – albo od razu użyć funkcji dstrsplit().

Instrukcje

100 XP
  • W funkcji make_msa_table() wczytaj każdy fragment jako ramkę danych.
  • Wywołaj chunk.apply(), aby wczytać dane porcjami.
  • Oblicz łączne sumy dla każdej kolumny, sumując wszystkie wiersze.