BaşlayınÜcretsiz Başlayın

Bir Machine Learning Modelinin Anatomisi

Şimdi, verinin model performansını nasıl etkilediğini pekiştireceksin. booking.csv dosyasındaki Airbnb rezervasyon veri kümesiyle çalışacaksın. Bu veri kümesi, bir kişinin rezervasyonu iptal edip etmeyeceğini tahmin etmeye yönelik sınıflandırma görevleri için uygundur. Birkaç sayısal ve kategorik sütun içerir. Sağlanan veri kümesini split_dataset.py betiğini kullanarak birbirini dışlayan üç örneğe ayıracaksın: train_A.csv, train_B.csv ve test.csv. Sonrasında, her bir eğitim veri kümesi için veri işleme ve model eğitimi hattını çalıştırıp bir Random Forest Classifier modeli eğitecek ve model_training.py ile test kümesi üzerinde performansını ölçeceksin. params.json içinde tanımlanan hiperparametreler her iki çalıştırmada da aynıdır.

Python betikleri komut satırı argümanlarını kabul edecek ve kabuk üzerinden çalışacak şekilde tasarlandı. Anlamanı derinleştirmek için bu betikleri özgürce inceleyebilirsin.

Bu egzersiz

DVC ile Veri Sürümlendirmeye Giriş

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

İnteraktif egzersizlerimizden biriyle teoriyi pratiğe dökün

Egzersizi başlat