1. Learn
  2. /
  3. 课程
  4. /
  5. Exersarea întrebărilor de interviu de statistică în Python

Connected

道练习

Sensibilitatea la valori extreme

Când analizăm relația dintre mai multe variabile, corelația este un bun punct de plecare. Dar cum se comportă corelația în cazul unor seturi de date mai interesante? Cât de robustă este față de valorile extreme (outliers)?

În acest exercițiu, vei reprezenta grafic și vei calcula corelația pentru un set de date cu o valoare extremă, apoi o vei elimina și vei observa ce se schimbă. La final, vei vedea cum se comportă corelația și vei trage o concluzie despre când și unde ar trebui să o folosești.

Un set de date din celebrul cuartet Anscombe a fost importat pentru tine ca variabila df, împreună cu toate pachetele utilizate anterior în acest capitol.

说明 1 / 共 3 个

undefined XP
    1
    2
    3
  • Afișează un grafic scatter matplotlib pentru caracteristicile X și Y; observă valoarea extremă din colțul din dreapta sus.