Nihai sınıflandırma modelini oluştur
Lojistik regresyon modelinin (0.4) ve en iyi performans gösteren random forest modelinin (0.2) duyarlılık (recall) performanslarını karşılaştırınca, en iyi performansa sahip modelin lojistik regresyon olduğunu öğrendin. Bu egzersizde, lojistik regresyon modelini tüm train verisini kullanarak kuracak ve bu modelin test performansını değerlendirmek için gerekli vektörleri hazırlayacaksın.
Bu egzersiz
Tidyverse ile Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
training_dataiçindeki tüm kullanılabilir özellikleri kullanarakAttrition’ı tahmin eden bir lojistik regresyon modeli kur.- Gerçek test değerlerinin ikili vektörünü,
test_actual, hazırla. - Olasılığın 0.5’ten büyük olmasının
TRUEanlamına geldiği ikili tahmin vektörünü hazırla ve bunutest_predictedolarak sakla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Build the logistic regression model using all training data
best_model <- glm(formula = ___,
data = ___, family = "binomial")
# Prepare binary vector of actual Attrition values for testing_data
test_actual <- testing_data$___ == "___"
# Prepare binary vector of predicted Attrition values for testing_data
test_predicted <- predict(___, ___, type = "response") > ___