or
Bu egzersiz, kursun bir parçasıdır
Bu bölümde sınıflandırma problemleriyle tanışacak ve bunları supervised learning teknikleriyle nasıl çözeceğini öğreneceksin. Veriyi eğitim ve test kümelerine ayırmayı, bir modeli eğitmeyi, tahmin yapmayı ve doğruluğu değerlendirmeyi göreceksin. Model karmaşıklığı ile performans arasındaki ilişkiyi keşfedecek ve öğrendiklerini bir churn veri kümesine uygulayarak, bir telekom şirketinin müşterilerinin churn durumunu sınıflandıracaksın.
Bu bölümde regresyona giriş yapacak ve reklam harcamalarına ilişkin bir veri kümesini kullanarak satış değerlerini tahmin eden modeller kuracaksın. Doğrusal regresyonun işleyişini ve R-kare ile kök ortalama kare hata gibi yaygın performans ölçütlerini öğreneceksin. k-katlı çapraz doğrulama yapacak ve aşırı uyum riskini azaltmak için regresyon modellerine düzenlileştirme uygulayacaksın.
Modelleri eğittikten sonra, şimdi onları nasıl değerlendireceğini öğreneceksin. Bu bölümde scikit-learn kullanarak sınıflandırma modeli performansını analiz etmek için birkaç ölçüt ve bir görselleştirme tekniğiyle tanışacaksın. Ayrıca hiperparametre ayarlaması yoluyla sınıflandırma ve regresyon modellerini nasıl optimize edeceğini öğreneceksin.
Eksik değerleri atama, kategorik verileri sayısal değerlere dönüştürme, veriyi ölçekleme, birden fazla supervised learning modelini aynı anda değerlendirme ve iş akışını hızlandırmak için boru hatları kurmayı öğren!
Geçerli egzersiz