CommencerCommencer gratuitement

Ici, il y a des dragons

Avant de vous emballer, un mot d'avertissement. Il y a encore des choses que vous ne pouvez pas faire avec Spark depuis R. Les interfaces Scala et Python pour Spark sont plus matures.

Cela signifie qu'avec ce cours, vous partez en terrain inexploré. Le voyage peut être un peu mouvementé, alors préparez-vous à sortir parfois de votre zone de confort.

Autre point d'attention : dans ce cours, vous exécuterez du code sur votre propre mini-cluster Spark personnel dans le cloud DataCamp. C'est idéal pour apprendre les concepts d'utilisation de Spark, mais vous n'obtiendrez pas le même gain de performance que sur un cluster distant avec un serveur haute performance. Cela signifie que les exemples ici ne s'exécuteront pas plus vite que si vous n'utilisiez que R, mais les compétences acquises vous permettront de lancer des analyses sur vos propres grands jeux de données.

Si vous souhaitez installer Spark sur votre machine locale, installez simplement le package sparklyr et appelez spark_install().

Êtes-vous sûr(e) de vouloir continuer ?

Cet exercice fait partie du cours

Introduction à Spark avec sparklyr en R

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice