Veri kalitesi kontrolleri
Önceki videoda öğrendiğin gibi, eksik değerler değerli bilgilerin kaybına yol açabilir ve yanlış yorumlara neden olabilir. Benzer şekilde, görülmemiş değerlerin varlığı da modelinin güvenini etkileyebilir.
Bu egzersizde, otel rezervasyonu veri kümesinde eksik değerler olup olmadığını incelemen ve herhangi bir görülmemiş değeri belirlemen gerekiyor. Başvuru (reference) ve analiz veri kümeleri ile nannyml kütüphanesi zaten yüklendi.
Kısa bir hatırlatma: Sütun türlerini hatırlamıyorsan, veriyi .head() yöntemiyle kolayca keşfedebilirsin.
Bu egzersiz
Python ile Machine Learning İzleme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Define analyzed columns
selected_columns = ['country', 'lead_time', 'parking_spaces', 'hotel']
# Intialize missing values calculator
ms_calc = ____.____(
____=____,
____=____,
timestamp_column_name='timestamp'
)
# Fit, calculate and plot the results
ms_calc.fit(reference)
ms_results = ms_calc.calculate(analysis)
ms_results.plot().show()