İlk pipeline'ını oluştur
Bir çalışma arkadaşın kredi skorlama veri kümesi için AdaBoostClassifier kullanmış. Sen de bir random forest sınıflandırıcıyı denemek istiyorsun. Bu egzersizde, bu sınıflandırıcıyı veriye uyduracak ve AdaBoostClassifier ile karşılaştıracaksın. Aşırı uyumu önlemek için eğitim/test veri bölme yöntemini kullandığından emin ol. Veriler önceden yüklenmiş ve tüm özellikler sayısal olacak şekilde dönüştürülmüş durumda. Özellikler X, etiketler y olarak mevcut. RandomForestClassifier modülü de önceden yüklendi.
Bu egzersiz, kursun bir parçasıdır
Python'da Machine Learning İş Akışları Tasarlama
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Split the data into train and test, with 20% as test
X_train, ____, ____, y_test = train_test_split(
X, y, ____=0.2, random_state=1)