1. Nauka
  2. /
  3. Kursy
  4. /
  5. Programowanie równoległe w R

Connected

ćwiczenie

Iterowanie i filtrowanie

Jako konsultant danych otrzymujesz dane w różnych formatach i postaciach. Klient właśnie przesłał plik CSV o rozmiarze 40 gigabajtów, zawierający dane o uczelniach wyższych z całego świata.

Młodsi analitycy nie są w stanie poprawnie wczytać tych danych z powodu braku pamięci, a budżet nie pozwala na zakup zasobów obliczeniowych potrzebnych do obsługi całego zbioru danych. Twoja bieżąca analiza wymaga jedynie danych dotyczących uczelni w Australii. Ścieżka do pliku CSV jest już zapisana w zmiennej filepath. Twoim zadaniem jest zaimplementowanie wydajnego mechanizmu odczytu tych danych. Pakiety parallel, doParallel, foreach i iterators są już wczytane.

Instrukcje

100 XP
  • Użyj iteratora do odczytu wierszy z pliku filepath.
  • Połącz wyniki za pomocą odpowiedniej funkcji, aby utworzyć ramkę danych.
  • Wskaż operator równoległy.