Kansen berekenen
Het where9am-data frame bevat gegevens van 91 dagen (dertien weken) waarin Brett elke dag om 9 uur zijn location heeft vastgelegd en of de daytype in het weekend of doordeweeks viel.
Met de onderstaande voorwaardelijke-kansformule kun je de kans berekenen dat Brett op kantoor aan het werk is, gegeven dat het een doordeweekse dag is.
$$ P(A|B) = \frac{P(A \text{ and } B)}{P(B)} $$
Dit soort berekeningen vormen de basis van het Naive Bayes-bestemmingsvoorspellingsmodel dat je in latere oefeningen gaat ontwikkelen.
Deze oefening maakt deel uit van de cursus
Supervised Learning in R: Classificatie
Oefeninstructies
- Vind P(office) door
nrow()ensubset()te gebruiken om rijen in de gegevensset te tellen en sla het resultaat op alsp_A. - Vind P(weekday), opnieuw met
nrow()ensubset(), en sla het resultaat op alsp_B. - Gebruik
nrow()ensubset()nog één keer om P(office and weekday) te vinden. Sla het resultaat op alsp_AB. - Bereken P(office | weekday) en sla het resultaat op als
p_A_given_B. - Print de waarde van
p_A_given_B.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Compute P(A)
p_A <- ___
# Compute P(B)
p_B <- ___
# Compute the observed P(A and B)
p_AB <- ___
# Compute P(A | B) and print its value
p_A_given_B <- ___
___