Aqui há dragões
Antes de se empolgar demais, um aviso. Existem coisas que você simplesmente não consegue fazer com Spark a partir do R neste momento. As interfaces de Scala e Python para o Spark são mais maduras.
Isso significa que você está navegando por território desconhecido neste curso. A jornada pode ser um pouco turbulenta, então esteja preparado para sair da sua zona de conforto de vez em quando.
Mais uma observação: neste curso, você vai executar código no seu mini cluster pessoal do Spark na nuvem da DataCamp. Isso é ideal para aprender os conceitos de uso do Spark, mas você não terá o mesmo ganho de desempenho que teria usando um cluster remoto em um servidor de alto desempenho. Ou seja, os exemplos aqui não vão rodar mais rápido do que se você estivesse usando apenas R, mas você pode aplicar as habilidades que aprender aqui para analisar seus próprios grandes conjuntos de dados.
Se quiser instalar o Spark no seu sistema local, basta instalar o pacote sparklyr e chamar spark_install().
Tem certeza de que deseja continuar?
Este exercício faz parte do curso
Introdução ao Spark com sparklyr em R
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício