or
Latihan ini merupakan bagian dari kursus
Bersiaplah untuk menyederhanakan himpunan data berukuran besar! Anda akan mempelajari konsep informasi, cara menilai kepentingan fitur, dan berlatih mengidentifikasi fitur dengan informasi rendah. Di akhir bab, Anda akan memahami perbedaan antara seleksi fitur dan ekstraksi fitur—dua pendekatan untuk reduksi dimensi.
Pelajari cara mengidentifikasi fitur yang kaya informasi dan miskin informasi melalui rasio nilai hilang, varians, dan korelasi. Kemudian Anda akan mempelajari cara membuat resep tidymodel untuk memilih fitur menggunakan indikator informasi ini.
Bab tiga memperkenalkan perbedaan antara pendekatan seleksi fitur tanpa supervisi dan tersupervisi. Anda akan meninjau cara menggunakan alur kerja tidymodels untuk membangun model. Lalu, Anda akan melakukan seleksi fitur tersupervisi menggunakan regresi lasso dan model random forest.
Di bab terakhir ini, Anda akan memperoleh intuisi yang kuat tentang ekstraksi fitur dengan memahami bagaimana komponen utama mengekstrak dan menggabungkan informasi terpenting dari berbagai fitur. Selanjutnya, pelajari dan terapkan tiga jenis ekstraksi fitur — principal component analysis (PCA), t-SNE, dan UMAP. Temukan bagaimana Anda dapat menggunakan metode ekstraksi fitur ini sebagai langkah prapemrosesan dalam proses pembangunan model dengan tidymodels.
Latihan Saat Ini