Identyfikacja niewiarygodnych źródeł danych

Twój zespół opracowuje model wspomagający generowanie dokładnych raportów w branży bezpieczeństwa motoryzacyjnego. Zebrano dane preferencji z trzech źródeł: „GlobalDrive Safety Institute", „AutoTech Safety Alliance" oraz „QuickScan Auto Review". Ostatnio pojawiły się wątpliwości co do wiarygodności tych danych i poproszono cię o ocenę, czy któreś ze źródeł jest niewiarygodne.

automotive_df to połączony DataFrame wczytany przy użyciu wstępnie zaimportowanej biblioteki pandas. Zawiera dane ze wszystkich trzech źródeł. Wstępnie zaimportowana funkcja majority_vote tworzy obiekt słownikopodobny z parą (chosen, rejected) wybraną głosowaniem większościowym dla każdego 'id'.

Zdefiniuj warunek zliczania jednej niezgodności z głosowaniem większościowym dla danego źródła danych.

ćwiczenie

Identyfikacja niewiarygodnych źródeł danych

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie