BaşlayınÜcretsiz Başlayın

Boru hattı veri sorunu

Hızlı bir boru hattı oluşturduktan sonra json dosyasını ekibindeki bir analiste veriyorsun. Analist veriyi yükleyip birkaç keşif adımı yaptıktan sonra, süre verisini sıralamaya çalışırken veri kümesinde bir sorun olduğunu söylüyor. Sıralama işlemi beklenildiği gibi çalışmadığı dışında sorunun ne olduğundan emin değil.

Date          Flight Number   Airport     Duration    ID

09/30/2015    2287            ANC         409         107962
12/28/2015    1408            OKC         41          141917
08/11/2015    2287            ANC         410         87978

Veriyi inceledikten sonra, hangi komut sorunu çözer?

Bu egzersiz

PySpark ile Veri Temizleme

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

İnteraktif egzersizlerimizden biriyle teoriyi pratiğe dökün

Egzersizi başlat