1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Foundations of PySpark

Connected

Cvičení

Rozdělení dat

Teď, když máš všechny úpravy za sebou, zbývá před samotným modelováním udělat jediné – rozdělit data!

Pokyny

100 XP
  • Pomocí metody .randomSplit() rozděl piped_data na dvě části: training s 60 % dat a test se 40 % dat – předej metodě .randomSplit() seznam [.6, .4].