BaşlayınÜcretsiz başlayın

Veriyi böl

Tüm dönüşümleri tamamladığına göre, modellemeden önceki son adım veriyi bölmek!

Bu egzersiz, kursun bir parçasıdır

PySpark Temelleri

Kursa Göz Atın

Egzersiz talimatları

  • DataFrame yöntemi .randomSplit() kullanarak piped_data'yı iki parçaya ayır: listenin [.6, .4] değerlerini .randomSplit() yöntemine geçirerek verinin %60'ını içeren training ve %40'ını içeren test.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Split the data into training and test sets
training, test = piped_data.randomSplit(____)
Kodu Düzenle ve Çalıştır