Métodos gráficos para evaluar la normalidad
En el vídeo, aprendiste a crear un histograma con 20 intervalos que representa la densidad de probabilidad de los datos de FTSE, y a añadir una distribución normal al gráfico como una línea roja:
> hist(ftse, nclass = 20, probability = TRUE)
> lines(ftse, dnorm(ftse, mean = mu, sd = sigma), col = "red")
Como ves, dnorm(x, mean, sd) calcula la función de densidad de probabilidad (PDF) de los datos x con la media y la desviación estándar muestrales calculadas; esto se conoce como el método de los momentos.
Por último, para calcular una estimación de la densidad de los datos x, usa density(x). Esto crea una estimación de densidad por kernel (KDE) mediante un método no paramétrico que no supone nada sobre la distribución subyacente.
Los distintos gráficos sugieren que los datos tienen colas más pesadas que la normal, aunque en próximos ejercicios verás pruebas gráficas y numéricas mejores.
En este ejercicio, ajustarás una distribución normal a los rendimientos logarítmicos del índice Dow Jones para 2008-2009 y compararás los datos con la distribución ajustada usando un histograma y un gráfico de densidad. El objeto djx con los datos del Dow Jones está cargado en tu espacio de trabajo.
Este ejercicio forma parte del curso
Gestión Cuantitativa del Riesgo en R
Instrucciones del ejercicio
- Calcula la media y la desviación estándar (
sd()) de los datosdjxy asígnalas amuysigma, respectivamente. - Dibuja un histograma de
djxcon 20 intervalos que represente la densidad de probabilidad de los datos. - Completa las funciones
lines()ydnorm()para añadir la curva de densidad normal dedjxcomo una línea roja al histograma. - Traza una estimación de densidad por kernel para
djxusandodensity(). - Usa el mismo comando
lines()de arriba para añadir la curva de densidad normal dedjxcomo una línea roja a la KDE.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Calculate average and standard deviation of djx
mu <- ___
sigma <- ___
# Plot histogram of djx
___(___)
# Add the normal density as a red line to histogram
lines(___, dnorm(___), col = ___)
# Plot non-parametric KDE of djx
___(___)
# Add the normal density as red line to KDE
lines(___, dnorm(___), col = ___)