1. Nauka
  2. /
  3. Kursy
  4. /
  5. Importowanie i zarządzanie danymi finansowymi w Pythonie

Connected

ćwiczenie

Globalne dochody: tendencja centralna

Najczęściej stosowane miary tendencji centralnej to średnia – suma wszystkich wartości podzielona przez ich liczbę – mediana, która dzieli dane na dwie równe połowy, oraz dominanta (moda), czyli wartość występująca najczęściej w zbiorze danych. Biblioteka pandas udostępnia funkcje umożliwiające obliczenie każdej z nich.

W tym zbiorze danych wartości kolumny 'Income per Capita' są liczbami zmiennoprzecinkowymi i nie ma wśród nich powtórzeń, więc uruchomienie income['Income per Capita'].mode() w konsoli zwraca pustą serię. W tym ćwiczeniu skorzystasz z operatora dzielenia całkowitego //, aby dodać nową kolumnę mierzącą dochód w tysiącach – zaokrągloną w dół – tak aby wartość taka jak 11 543,43 stała się po prostu 11. Następnie uruchomisz powyższe funkcje, by lepiej zrozumieć rozkład dochodów.

Biblioteka pandas jest zaimportowana jako pd, a ramka danych income z poprzedniego ćwiczenia jest dostępna w twoim obszarze roboczym.

Instrukcje

100 XP
  • Użyj odpowiedniej funkcji, aby obliczyć globalną średnią kolumny 'Income per Capita'.
  • Użyj odpowiedniej funkcji, aby obliczyć globalną medianę kolumny 'Income per Capita'.
  • Korzystając z rozgłaszania (broadcasting), utwórz nową kolumnę 'Income per Capita (,000)' równą income['Income per Capita'] // 1000. Następnie użyj odpowiedniej funkcji, aby obliczyć dominantę (modę) dla tej nowej kolumny.