Fonction de répartition cumulée
Comprendre la distribution logistique est essentiel pour comprendre la régression logistique. Comme la distribution normale (gaussienne), c’est une distribution de probabilité d’une variable continue. Ici, vous allez visualiser la fonction de répartition cumulée (CDF) de la distribution logistique. Autrement dit, si vous avez une variable logistique, x, et une valeur possible xval que x pourrait prendre, la CDF donne la probabilité que x soit inférieure à xval.
La CDF de la distribution logistique est calculée avec la fonction logistique (d’où son nom). Sa courbe a une forme en S, appelée courbe sigmoïde. Une propriété importante de cette fonction est qu’elle prend en entrée n’importe quel nombre, de moins l’infini à plus l’infini, et renvoie une valeur comprise entre zéro et un.
ggplot2 est chargé.
Cet exercice fait partie du cours
Régression intermédiaire en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
logistic_distn_cdf <- tibble(
# Make a seq from -10 to 10 in steps of 0.1
x = ___,
# Transform x with built-in logistic CDF
logistic_x = ___,
# Transform x with manual logistic
logistic_x_man = ___
)
# Check that each logistic function gives the same results
all.equal(
___,
___
)