or
Bu egzersiz, kursun bir parçasıdır
Ham veriler analiz için her zaman ideal biçimde gelmez. Bu açılış bölümünde, modelinin performansını ve yorumlanabilirliğini artıran özellikleri nasıl dönüştürüp oluşturabileceğine ilk bakışı atacağız.
Bu bölümde, özellikleri elle dönüştürmenin ötesinde, tidyverse araçlarını kullanarak programatik olarak yeni değişkenler türetebileceğini öğreneceksin. Bu yaklaşımın modellerinin yeniden üretilebilirliğini nasıl geliştirdiğini ve özellikle çok sayıda özelliğe sahip veri kümelerini işlerken neden faydalı olduğunu keşfedeceksin.
Şimdi, modellerin sıklıkla boyutu azaltmaktan ve yüksek boyutlu veriden özellik çıkarmaktan nasıl yarar sağladığını öğreneceksin; buna metin verisini sayısal değerlere dönüştürme, kategorik veriyi kodlama ve değişkenlerin kestirim gücünü derecelendirme de dahildir. Başlıca yöntemler olarak temel bileşenler analizi, çekirdek temel bileşenler analizi, metinden sayısal çıkarım, kategorik kodlamalar ve değişken önem skorlarını inceleyeceksin.
Kursu, feature engineering ve Machine Learning tekniklerini öğrenerek tamamlayacaksın. Önce, bir modelde mevcut tüm özellikleri kullanmanın yol açtığı sorunlara, ilgisiz ve yinelenen özellikleri belirlemenin önemine ve bu özellikleri lasso ve elastic-net gibi gömülü yöntemlerle kaldırmayı öğrenmeye odaklanacaksın. Ardından, katsayıları sıfıra çekerek özellik ağırlıklarını düzenlemek veya özellik seçimi yapmak için kullanılabilen lasso, ridge ve elastic-net gibi küçültme yöntemlerini keşfedeceksin. Son olarak, uçtan uca bir feature engineering iş akışı oluşturup küçük bir projede önceki kavram ve fonksiyonları gözden geçirip uygulayarak bitireceksin.
Geçerli egzersiz