Lojistik regresyon nedir?
Bu bölümde kuracağın modele lojistik regresyon denir. Bu model, doğrusal regresyona oldukça benzer; ancak sayısal bir değişken tahmin etmek yerine bir olayın gerçekleşme olasılığını (0 ile 1 arasında) tahmin eder.
Bunu bir sınıflandırma algoritması olarak kullanmak için yapman gereken tek şey bu olasılıklar için bir eşik değeri belirlemek. Eğer tahmin edilen olasılık eşik değerinin üzerindeyse o gözlemi 'evet' (bu durumda uçağın geç kalması) olarak sınıflandırırsın; altındaysa 'hayır' olarak sınıflandırırsın!
Bu modeli, birkaç hiperparametre için farklı değerler deneyerek ayarlayacaksın. Bir hiperparametre, veriden tahmin edilmeyen; performansı en üst düzeye çıkarmak için kullanıcı tarafından sağlanan bir model değeridir. Bu kursta bu değerlerin ardındaki matematiği ayrıntılı olarak anlaman gerekmiyor — önemli olan, birkaç farklı seçeneği deneyecek ve en iyisini seçecek olman.
Neden hiperparametre sağlarsın?
Bu egzersiz
PySpark Temelleri
kursunun bir parçasıdırUygulamalı interaktif egzersiz
İnteraktif egzersizlerimizden biriyle teoriyi pratiğe dökün
Egzersizi başlat