La media delle medie

Vuoi sapere qual è il numero medio di utenti (num_users) per deal, ma ti serve questo valore per l’intera azienda, così da capire se i deal di Amir hanno più o meno utenti rispetto alla media aziendale. Il problema è che nell’ultimo anno l’azienda ha lavorato a più di diecimila deal, quindi non è realistico raccogliere tutti i dati. Al contrario, stimerai la media prendendo diversi campioni casuali di deal, perché è molto più semplice che raccogliere dati da tutta l’azienda.

amir_deals è disponibile e i dati sugli utenti per tutti i deal dell’azienda sono in all_deals. Sia pandas come pd sia numpy come np sono già caricati.

Questo esercizio fa parte del corso

Introduzione alla statistica in Python

Visualizza corso

Istruzioni dell'esercizio

Imposta il seme casuale a 321.
Prendi 30 campioni (con reinserimento) di dimensione 20 da all_deals['num_users'] e calcola la media di ciascun campione. Salva le medie campionarie in sample_means.
Stampa la media di sample_means.
Stampa la media della colonna num_users di amir_deals.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Set seed to 321
____

sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
  # Take sample of size 20 from num_users col of all_deals with replacement
  cur_sample = ____
  # Take mean of cur_sample
  cur_mean = ____
  # Append cur_mean to sample_means
  sample_means.append(____)

# Print mean of sample_means
print(____)

# Print mean of num_users in amir_deals
print(____)

Modifica ed esegui il codice

Questo esercizio fa parte del corso

Introduzione alla statistica in Python

IntermediárioNível de habilidade

4.8+

Inizia il corso gratuitamente

Le statistiche riassuntive ti forniscono gli strumenti per sintetizzare insiemi di dati enormi e metterne in evidenza i punti chiave. In questo capitolo esplorerai statistiche riassuntive come media, mediana e deviazione standard, e imparerai a interpretarle correttamente. Svilupperai anche il pensiero critico, così da scegliere le statistiche riassuntive più adatte ai tuoi dati.

Exercise 1: Che cos'è la statistica?Exercise 2: Statistica descrittiva e inferenziale Exercise 3: Classificazione dei tipi di dati Exercise 4: Misure di tendenza centrale Exercise 5: Calcolare media e mediana Exercise 6: Media, mediana e forma della distribuzione Exercise 7: Misure di dispersione Exercise 8: Varianza e deviazione standard Exercise 9: Quartili, quantili e quintili Exercise 10: Individuare gli outlier usando l'IQR

In questo capitolo imparerai a generare campioni casuali e a misurare il caso usando la probabilità. Lavorerai con dati di vendita reali per calcolare la probabilità che un/una venditore/venditrice abbia successo. Infine, userai la distribuzione binomiale per modellare eventi con esiti binari.

Exercise 1: Quali sono le probabilità?Exercise 2: Con o senza reimmissione?Exercise 3: Calcolare le probabilità Exercise 4: Campionare le trattative Exercise 5: Distribuzioni discrete Exercise 6: Creare una distribuzione di probabilità Exercise 7: Riconoscere le distribuzioni Exercise 8: Valore atteso vs. media campionaria Exercise 9: Distribuzioni continue Exercise 10: Quale distribuzione?Exercise 11: Backup dei dati Exercise 12: Simulare i tempi di attesa Exercise 13: La distribuzione binomiale Exercise 14: Simulare gli accordi di vendita Exercise 15: Calcolare probabilità binomiali Exercise 16: Quante vendite verranno vinte?

È il momento di esplorare una delle distribuzioni di probabilità più importanti in statistica: la distribuzione normale. Creerai istogrammi per rappresentare distribuzioni normali e comprenderai il teorema del limite centrale, per poi ampliare le tue conoscenze sulle funzioni statistiche aggiungendo al tuo repertorio le distribuzioni di Poisson, esponenziale e t.

Exercise 1: La distribuzione normale Exercise 2: Distribuzione delle vendite di Amir Exercise 3: Probabilità dalla distribuzione normale Exercise 4: Simulare le vendite in nuove condizioni di mercato Exercise 5: Quale mercato è migliore?Exercise 6: Il teorema centrale del limite Exercise 7: Visualizzare le distribuzioni campionarie Exercise 8: Il TCL in azione Exercise 9: La media delle medie

Esercizio attuale

Exercise 10: La distribuzione di Poisson Exercise 11: Identificare lambda Exercise 12: Monitorare le risposte ai lead Exercise 13: Altre distribuzioni di probabilità Exercise 14: Trascina e rilascia le distribuzioni Exercise 15: Modellare il tempo tra i lead Exercise 16: La distribuzione t

In questo capitolo imparerai a quantificare l’intensità di una relazione lineare tra due variabili ed esplorerai come le variabili confondenti possano influenzare la relazione tra altre due variabili. Vedrai anche come il disegno di uno studio possa influenzarne i risultati, cambiare il modo in cui i dati devono essere analizzati e potenzialmente incidere sull’affidabilità delle tue conclusioni.

Exercise 1: Correlazione Exercise 2: Indovina la correlazione Exercise 3: Relazioni tra variabili Exercise 4: Avvertenze sulla correlazione Exercise 5: Cosa non può misurare la correlazione?Exercise 6: Trasformare le variabili Exercise 7: Lo zucchero migliora la felicità?Exercise 8: Fattori confondenti Exercise 9: Progettazione degli esperimenti Exercise 10: Tipi di studi Exercise 11: Studi longitudinali vs. trasversali Exercise 12: Congratulazioni!