İlk pipeline'ını oluştur
Bir çalışma arkadaşın kredi skorlama veri kümesi için AdaBoostClassifier kullanmış. Sen de bir random forest sınıflandırıcıyı denemek istiyorsun. Bu egzersizde, bu sınıflandırıcıyı veriye uyduracak ve AdaBoostClassifier ile karşılaştıracaksın. Aşırı uyumu önlemek için eğitim/test veri bölme yöntemini kullandığından emin ol. Veriler önceden yüklenmiş ve tüm özellikler sayısal olacak şekilde dönüştürülmüş durumda. Özellikler X, etiketler y olarak mevcut. RandomForestClassifier modülü de önceden yüklendi.
Bu egzersiz
Python'da Machine Learning İş Akışları Tasarlama
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Split the data into train and test, with 20% as test
X_train, ____, ____, y_test = train_test_split(
X, y, ____=0.2, random_state=1)