or
Latihan ini merupakan bagian dari kursus
Pada bab ini, Anda akan mengeksplorasi apa itu rekayasa fitur dan cara memulainya pada data dunia nyata. Anda akan memuat, mengeksplorasi, dan memvisualisasikan himpunan data respons survei, dan melalui itu Anda akan mempelajari tipe data dasarnya serta mengapa hal tersebut memengaruhi cara Anda merekayasa fitur. Dengan paket pandas, Anda akan membuat fitur baru dari kolom kategorikal dan kontinu.
Bab ini memperkenalkan Anda pada realitas data yang berantakan dan tidak lengkap. Anda akan mempelajari cara menemukan nilai hilang dalam data Anda dan mengeksplorasi berbagai pendekatan untuk menanganinya. Anda juga akan menggunakan teknik manipulasi string untuk menangani karakter yang tidak diinginkan dalam himpunan data Anda.
Pada bab ini, Anda akan berfokus pada analisis distribusi dasar data Anda dan apakah hal tersebut akan memengaruhi pipeline Machine Learning Anda. Anda akan mempelajari cara menangani data miring dan situasi ketika pencilan dapat berdampak negatif pada analisis Anda.
Terakhir, pada bab ini, Anda akan bekerja dengan data teks tidak terstruktur, memahami cara merekayasa fitur kolumnar dari suatu korpus teks. Anda akan membandingkan bagaimana pendekatan berbeda dapat memengaruhi seberapa banyak konteks yang diekstraksi dari teks, serta bagaimana menyeimbangkan kebutuhan konteks tanpa menghasilkan terlalu banyak fitur.
Latihan Saat Ini