Het gemiddelde van gemiddelden

Je wilt weten wat het gemiddelde aantal gebruikers (num_users) per deal is, maar je wilt dit weten voor het hele bedrijf zodat je kunt zien of Amirs deals meer of minder gebruikers hebben dan de gemiddelde deal van het bedrijf. Het probleem is dat het bedrijf het afgelopen jaar aan meer dan tienduizend deals heeft gewerkt, dus het is niet realistisch om alle data te verzamelen. In plaats daarvan schat je het gemiddelde door meerdere willekeurige steekproeven van deals te nemen, omdat dit veel makkelijker is dan gegevens van iedereen in het bedrijf verzamelen.

De gebruikersdata voor alle deals van het bedrijf is beschikbaar in all_deals.

Deze oefening maakt deel uit van de cursus

Inleiding tot statistiek in R

Oefeninstructies

Zet de random seed op 321.
Neem 30 steekproeven van grootte 20 uit all_deals$num_users en bereken het gemiddelde van elke steekproef. Sla de steekproefgemiddelden op in sample_means.
Neem het gemiddelde van sample_means.
Neem het gemiddelde van de kolom num_users van amir_deals.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Set seed to 321
___

# Take 30 samples of 20 values of num_users, take mean of each sample
sample_means <- ___(___, ___(___, ___) %>% mean())

# Calculate mean of sample_means
___

# Calculate mean of num_users in amir_deals
___

Code bewerken en uitvoeren

Deze oefening maakt deel uit van de cursus

Inleiding tot statistiek in R

SkillTag.level.intermediateSkillTag.label

4.8+

Begin gratis met de cursus

Samenvattende statistieken geven je de tools om grote gegevenssets terug te brengen tot de kern. In dit hoofdstuk verken je samenvattende statistieken zoals gemiddelde, mediaan en standaarddeviatie, en leer je ze correct te interpreteren. Je scherpt ook je kritisch denkvermogen, zodat je de beste samenvattende statistieken voor jouw data kunt kiezen.

Exercise 1: Wat is statistiek?Exercise 2: Beschrijvende en inferentiële statistiek Exercise 3: Classificatie van datatypes Exercise 4: Maten van centrum Exercise 5: Gemiddelde en mediaan Exercise 6: Gemiddelde vs. mediaan Exercise 7: Spreidingsmaten Exercise 8: Variantie en standaardafwijking Exercise 9: Kwartielen, kwantielen en kwintielen Exercise 10: Uitschieters vinden met IQR

In dit hoofdstuk leer je hoe je willekeurige steekproeven genereert en toeval meet met kansrekening. Je werkt met verkoopdata uit de praktijk om de kans te berekenen dat een verkoper succesvol is. Tot slot gebruik je de binomiale verdeling om gebeurtenissen met binaire uitkomsten te modelleren.

Exercise 1: Hoe groot is de kans?Exercise 2: Met of zonder terugleggen?Exercise 3: Kansen berekenen Exercise 4: Deals steekproeven Exercise 5: Discrete verdelingen Exercise 6: Een kansverdeling maken Exercise 7: Verdelingen herkennen Exercise 8: Verwachtingswaarde vs. steekproefgemiddelde Exercise 9: Continue verdelingen Exercise 10: Welke verdeling?Exercise 11: Back-ups van data Exercise 12: Wachttijden simuleren Exercise 13: De binomiale verdeling Exercise 14: Verkoopdeals simuleren Exercise 15: Binomiale kansen berekenen Exercise 16: Hoeveel sales worden er gewonnen?

Tijd om een van de belangrijkste kansverdelingen in de statistiek te verkennen: de normale verdeling. Je maakt histogrammen om normale verdelingen te plotten en krijgt inzicht in de centrale limietstelling. Vervolgens breid je je kennis van statistische functies uit met de Poisson-, exponentiële en t-verdelingen.

Exercise 1: De normale verdeling Exercise 2: Verdeling van Amirs verkopen Exercise 3: Kansen uit de normale verdeling Exercise 4: Verkoop simuleren onder nieuwe marktomstandigheden Exercise 5: Welke markt is beter?Exercise 6: De centrale limietstelling Exercise 7: Steekproefverdelingen visualiseren Exercise 8: De CLT in de praktijk Exercise 9: Het gemiddelde van gemiddelden

Huidige oefening

Exercise 10: De Poissonverdeling Exercise 11: Lambda herkennen Exercise 12: Reacties op leads bijhouden Exercise 13: Meer kansverdelingen Exercise 14: Te veel verdelingen Exercise 15: Tijd tussen leads modelleren Exercise 16: De t-verdeling

In dit hoofdstuk leer je hoe je de sterkte van een lineaire relatie tussen twee variabelen kwantificeert en verken je hoe confounders de relatie tussen twee andere variabelen kunnen beïnvloeden. Je ziet ook hoe de opzet van een onderzoek de resultaten kan sturen, de manier van analyseren kan veranderen en mogelijk de betrouwbaarheid van je conclusies beïnvloedt.

Exercise 1: Correlatie Exercise 2: Raad de correlatie Exercise 3: Relaties tussen variabelen Exercise 4: Kanttekeningen bij correlatie Exercise 5: Wat kan correlatie niet meten?Exercise 6: Variabelen transformeren Exercise 7: Maakt suiker gelukkiger?Exercise 8: Confounders Exercise 9: Experimenteel ontwerp Exercise 10: Type onderzoeken Exercise 11: Longitudinale vs. dwarsdoorsnede-onderzoeken Exercise 12: Gefeliciteerd!