Veri kalitesi kontrolleri
Önceki videoda öğrendiğin gibi, eksik değerler değerli bilgilerin kaybına yol açabilir ve yanlış yorumlara neden olabilir. Benzer şekilde, görülmemiş değerlerin varlığı da modelinin güvenini etkileyebilir.
Bu egzersizde, otel rezervasyonu veri kümesinde eksik değerler olup olmadığını incelemen ve herhangi bir görülmemiş değeri belirlemen gerekiyor. Başvuru (reference) ve analiz veri kümeleri ile nannyml kütüphanesi zaten yüklendi.
Kısa bir hatırlatma: Sütun türlerini hatırlamıyorsan, veriyi .head() yöntemiyle kolayca keşfedebilirsin.
Bu egzersiz, kursun bir parçasıdır
Python ile Machine Learning İzleme
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Define analyzed columns
selected_columns = ['country', 'lead_time', 'parking_spaces', 'hotel']
# Intialize missing values calculator
ms_calc = ____.____(
____=____,
____=____,
timestamp_column_name='timestamp'
)
# Fit, calculate and plot the results
ms_calc.fit(reference)
ms_results = ms_calc.calculate(analysis)
ms_results.plot().show()