Czyszczenie zbioru danych

Rzeczywiste zbiory danych, takie jak zbiór danych o chorobach serca, często są nieuporządkowane – zawierają zduplikowane lub brakujące wartości. W tym ćwiczeniu zastosujesz umiejętności zdobyte w tym rozdziale, aby wyczyścić zbiór danych o chorobach serca. Zbiór danych został już wczytany. Twoim zadaniem jest zidentyfikowanie i wykonanie ogólnych operacji czyszczenia na podstawie wyników EDA: usunięcie pustych kolumn, usunięcie zduplikowanych wierszy oraz imputacja kolumny restecg, która odnosi się do miary elektrokardiogramu. Biblioteka Pandas została zaimportowana jako pd, a zbiór danych o chorobach serca jest przechowywany jako DataFrame o nazwie heart_disease_df.

Usuń pustą kolumnę "oldpeak".

ćwiczenie

Czyszczenie zbioru danych

Instrukcje 1/4

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje 1/4

ćwiczenie