Yüksek korelasyonlu bir recipe oluştur
Yüksek korelasyonlu özellikleri belirledikten sonra, bunları elle kaldırmak yerine tidymodels içindeki step_corr() adımını kullanabilirsin. step_corr(), diğer özelliklerle korelasyonlu olan tüm özellikleri kaldırmaz; mümkün olduğunca az özelliği kaldırmaya çalışır. Kavramsal olarak, çoktan seçmeli egzersizde de gördüğün gibi, diğer özelliklerin herhangi bir kombinasyonuyla en fazla örtüşmeye sahip olan özelliği kaldırır. Fikir şudur: Diğer özellikler aynı bilgiyi içerdiğinden, kaldırılan özelliğin örtüşen bilgisi yine bu diğer özelliklerde temsil edilmeye devam eder.
tidyverse ve tidymodels paketleri senin için yüklendi.
Bu egzersiz
R'de Boyutsal Azaltma
kursunun bir parçasıdırEgzersiz talimatları
- Yalnızca sayısal yordayıcılara uygulanacak şekilde, eşiği 0.7 olan
step_corr()kullanan bir recipe oluştur. - Recipe'i
house_sales_dfüzerine uygula ve filtrelenmiş veriyifiltered_house_sales_dfiçinde sakla. step_corr()filtresinin kaldırdığı sütun veya sütunları belirlemek içintidy()kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a recipe using step_corr to remove numeric predictors correlated > 0.7
corr_recipe <-
___(price ~ ., data = ___) %>%
___(___, ___ = ___) %>%
___(___)
# Apply the recipe to the data
___ <-
___ %>%
___(new_data = ___)
# Identify the features that were removed
___(___, ___ = ___)