1. Learn
  2. /
  3. Courses
  4. /
  5. Manipulacja danymi w Julii

Connected

Exercise

Zastępowanie ocen medianą grupy

W poprzednim ćwiczeniu zastąpiłeś brakujące wartości w kolumnie rating medianą całej kolumny. Czy można to zrobić lepiej? Tak! Możesz zastąpić brakujące wartości medianą ocen czekolad pochodzących od tej samej firmy. Do dzieła!

Do dyspozycji masz gotową funkcję replace_missing(), która przyjmuje dwa argumenty – DataFrame group i kolumnę col. Funkcja próbuje obliczyć medianę kolumny col i zwraca ją, jeśli obliczenie się powiedzie. Jeśli obliczenie mediany nie jest możliwe – na przykład dlatego, że kolumna nie zawiera żadnych wartości – funkcja zwraca z góry zdefiniowaną wartość.

Zbiór danych chocolates oraz pakiety DataFrames i Statistics zostały już wczytane.

Instructions

100 XP
  • Pogrupuj chocolates według company i przejdź iteracyjnie przez GroupedDataFrame.
  • Przefiltruj każdą grupę za pomocą ismissing() i kolumny rating, zastępując brakujące wartości wynikiem funkcji replace_missing().