1. Learn
  2. /
  3. Cursuri
  4. /
  5. Eșantionare în Python

Connected

exercițiu

Rezultatele eșantionului sunt generalizabile?

Tocmai ai văzut cum eșantionarea de conveniență—colectarea datelor prin metoda cea mai la îndemână—poate produce eșantioane care nu sunt reprezentative pentru populație. Cu alte cuvinte, concluziile trase din eșantion nu pot fi generalizate la nivelul întregii populații. Vizualizarea distribuțiilor populației și ale eșantionului te poate ajuta să determini dacă eșantionul este sau nu reprezentativ.

Setul de date Spotify conține o coloană acousticness, care reprezintă un scor de încredere între zero și unu, indicând probabilitatea ca piesa să fi fost înregistrată cu instrumente acustice (neplugate). Vei compara distribuția acousticness pentru întreaga populație de melodii cu cea a unui eșantion din aceste melodii.

spotify_population și spotify_mysterious_sample sunt disponibile; pandas ca pd, matplotlib.pyplot ca plt și numpy ca np sunt încărcate.

Instrucțiuni 1/3

undefined XP
    1
    2
    3
  • Trasează un histogram al valorilor acousticness din spotify_population cu intervale de lățime 0.01, de la 0 la 1, folosind .hist() din pandas.