Code auf dem Cluster ausführen
Du arbeitest in einer Datenberatung, und in deinem Unternehmen wird viel paralleler R-Code verwendet. In letzter Zeit sind die Ergebnisse jedoch unzuverlässig, und manchmal liefert der Code für dieselben Eingaben unterschiedliche Resultate. Bevor du weiter nach Fehlern suchst, möchtest du einen grundlegenden Check auf jedem Cluster durchführen.
Du hast eine Variable test_var erstellt und die Summe aller ihrer Elemente, test_sum, berechnet. Du willst prüfen, ob jeder Cluster diese Variable korrekt summieren kann. Das Paket parallel wurde bereits für dich geladen.
Diese Übung ist Teil des Kurses
Paralleles Programmieren in R
Anleitung zur Übung
- Erzeuge einen Cluster mit vier Kernen.
- Exportiere
test_varundtest_sumin den Cluster. - Gib „Accuracy OK“ aus, wenn die Summe von
test_vargleichtest_sumist, sonst gib „Errors“ aus. - Stoppe den Cluster.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Make a cluster of four cores
cl <- ___
# Export test_var and test_sum to cluster
clusterExport(___, ___, envir = environment())
# Check the sum on cluster
clusterEvalQ(___, {
___
})
# Stop cluster
___