Aan de slagGa gratis aan de slag

Code draaien op het cluster

Je werkt bij een dataconsultancy en je bedrijf gebruikt veel parallelle R-code. Maar de resultaten zijn de laatste tijd grillig, en soms geeft de code verschillende uitkomsten voor dezelfde input. Voordat je verder gaat met troubleshooten, heb je besloten een basischeck op elk cluster uit te voeren.

Je hebt een variabele test_var gemaakt en de som van alle elementen berekend als test_sum. Je wilt controleren of elk cluster deze variabele correct kan sommeren. Het pakket parallel is al voor je geladen.

Deze oefening maakt deel uit van de cursus

Parallel programmeren in R

Cursus bekijken

Oefeninstructies

  • Maak een cluster met vier cores.
  • Exporteer test_var en test_sum naar het cluster.
  • Print "Accuracy OK" als de som van test_var gelijk is aan test_sum, anders print je "Errors".
  • Stop het cluster.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Make a cluster of four cores
cl <- ___
# Export test_var and test_sum to cluster
clusterExport(___, ___, envir = environment())
# Check the sum on cluster
clusterEvalQ(___, {
  ___
  
  
})
# Stop cluster
___
Code bewerken en uitvoeren