Code draaien op het cluster
Je werkt bij een dataconsultancy en je bedrijf gebruikt veel parallelle R-code. Maar de resultaten zijn de laatste tijd grillig, en soms geeft de code verschillende uitkomsten voor dezelfde input. Voordat je verder gaat met troubleshooten, heb je besloten een basischeck op elk cluster uit te voeren.
Je hebt een variabele test_var gemaakt en de som van alle elementen berekend als test_sum. Je wilt controleren of elk cluster deze variabele correct kan sommeren. Het pakket parallel is al voor je geladen.
Deze oefening maakt deel uit van de cursus
Parallel programmeren in R
Oefeninstructies
- Maak een cluster met vier cores.
- Exporteer
test_varentest_sumnaar het cluster. - Print "Accuracy OK" als de som van
test_vargelijk is aantest_sum, anders print je "Errors". - Stop het cluster.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Make a cluster of four cores
cl <- ___
# Export test_var and test_sum to cluster
clusterExport(___, ___, envir = environment())
# Check the sum on cluster
clusterEvalQ(___, {
___
})
# Stop cluster
___