BaşlayınÜcretsiz Başlayın

Veriyi böl

Tüm dönüşümleri tamamladığına göre, modellemeden önceki son adım veriyi bölmek!

Bu egzersiz

PySpark Temelleri

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • DataFrame yöntemi .randomSplit() kullanarak piped_data'yı iki parçaya ayır: listenin [.6, .4] değerlerini .randomSplit() yöntemine geçirerek verinin %60'ını içeren training ve %40'ını içeren test.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Split the data into training and test sets
training, test = piped_data.randomSplit(____)
Kodu Düzenle ve Çalıştır