Identifikace nespolehlivých zdrojů dat

Tvůj tým vyvíjí model pro podporu tvorby přesných reportů v oblasti automobilové bezpečnosti. Shromáždil/a jsi preferenční data ze tří zdrojů – „GlobalDrive Safety Institute", „AutoTech Safety Alliance" a „QuickScan Auto Review". Nedávno se objevily obavy ohledně integrity dat a tvým úkolem je posoudit, zda některý ze zdrojů není nespolehlivý.

automotive_df je kombinovaný DataFrame načtený pomocí předem importované knihovny pandas. Obsahuje data ze všech tří zdrojů. Předem importovaná funkce majority_vote vytvoří slovníkový objekt s většinovým párem (chosen, rejected) pro každé 'id'.

Definuj podmínku pro zaznamenání jedné neshody s většinovým hlasováním u daného zdroje dat.

cvičení

Identifikace nespolehlivých zdrojů dat

Pokyny

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení