or
Latihan ini merupakan bagian dari kursus
Data mentah tidak selalu hadir dalam bentuk terbaiknya untuk dianalisis. Pada bab pembuka ini, Anda akan melihat pertama kali cara mentransformasi dan membuat fitur yang meningkatkan kinerja serta keterjelasan model Anda.
Di bab ini, Anda akan mempelajari bahwa, selain mentransformasi fitur secara manual, Anda dapat memanfaatkan alat dari tidyverse untuk merekayasa variabel baru secara terprogram. Anda akan menelusuri bagaimana pendekatan ini meningkatkan reprodusibilitas model dan sangat berguna saat menangani himpunan data dengan banyak fitur.
Sekarang Anda akan mempelajari bagaimana model sering kali diuntungkan dari pengurangan dimensi dan ekstraksi fitur dari data berdimensi tinggi, termasuk mengonversi data teks menjadi nilai numerik, melakukan pengodean data kategorikal, dan memberi peringkat kekuatan prediktif variabel. Anda akan mengeksplorasi metode seperti principal component analysis, kernel principal component analysis, ekstraksi numerik dari teks, pengodean kategorikal, dan skor pentingnya variabel.
Anda akan menutup kursus dengan mempelajari teknik rekayasa fitur dan Machine Learning. Anda akan mulai dengan berfokus pada masalah yang terkait dengan penggunaan semua fitur yang tersedia dalam sebuah model dan pentingnya mengidentifikasi fitur yang tidak relevan dan redundan serta mempelajari cara menghapus fitur-fitur tersebut menggunakan metode embedded seperti lasso dan elastic-net. Selanjutnya, Anda akan mengeksplorasi metode shrinkage seperti lasso, ridge, dan elastic-net, yang dapat digunakan untuk melakukan regularisasi bobot fitur atau memilih fitur dengan menyetel koefisien menjadi nol. Terakhir, Anda akan menutup dengan membuat alur kerja rekayasa fitur end-to-end serta meninjau dan mempraktikkan konsep serta fungsi yang telah dipelajari sebelumnya dalam sebuah proyek kecil.
Latihan Saat Ini