Simulierte und historische Daten vergleichen
Eine gute Simulation sollte ähnliche Ergebnisse wie die historischen Daten liefern. Trifft das auf die Simulation im Video zu? In dieser Übung schaust du dir eine Möglichkeit an, die Simulationsergebnisse zu prüfen – und findest es heraus!
Zuerst führst du eine Simulation mit der multivariaten Normalverteilung sowie dem Mittelwert und der Kovarianzmatrix von dia durch. Anschließend vergleichst du die Mittelwerte der historischen und der simulierten Daten. Sind sie ähnlich?
Der Diabetes-Datensatz wurde als DataFrame dia geladen. Außerdem wurden diese Bibliotheken für dich importiert: pandas als pd, numpy als np und scipy.stats als st.
Diese Übung ist Teil des Kurses
Monte-Carlo-Simulationen in Python
Anleitung zur Übung
- Führe die Simulation 10.000-mal mit der multivariaten Normalverteilung sowie dem Mittelwert und der Kovarianzmatrix von
diaaus. - Verwende die
.mean()-Funktion in pandas, um die Mittelwerte der Spaltenbmiundtcdes historischen Datensatzesdiaund der simuliertenbmi- undtc-Ergebnisse ausdf_resultszu berechnen und zu prüfen, ob sie ähnlich sind. - Verwende entsprechend
.cov()aus pandas, um die Kovarianzmatrix der Spaltenbmiundtcvondiasowie der simuliertenbmi- undtc-Ergebnisse ausdf_resultszu berechnen und zu beurteilen, ob sie ähnlich sind.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
cov_dia = dia[["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"]].cov()
mean_dia = dia[["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"]].mean()
# Complete the code to perform the simulation
simulation_results = st.multivariate_normal.rvs(____)
df_results = pd.DataFrame(simulation_results,columns=["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"])
# Calculate bmi and tc means for the historical and simulated results
print(dia[["bmi","tc"]].____)
print(____)
# Calculate bmi and tc covariances for the historical and simulated results
print(____)
print(____)