Boru hattı veri sorunu
Hızlı bir boru hattı oluşturduktan sonra json dosyasını ekibindeki bir analiste veriyorsun. Analist veriyi yükleyip birkaç keşif adımı yaptıktan sonra, süre verisini sıralamaya çalışırken veri kümesinde bir sorun olduğunu söylüyor. Sıralama işlemi beklenildiği gibi çalışmadığı dışında sorunun ne olduğundan emin değil.
Date Flight Number Airport Duration ID
09/30/2015 2287 ANC 409 107962
12/28/2015 1408 OKC 41 141917
08/11/2015 2287 ANC 410 87978
Veriyi inceledikten sonra, hangi komut sorunu çözer?
Bu egzersiz
PySpark ile Veri Temizleme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
İnteraktif egzersizlerimizden biriyle teoriyi pratiğe dökün
Egzersizi başlat