Examiner les données de régression
Le jeu de données suivant contient des informations sur la valeur boursière d’entreprises sur plusieurs années. C’est l’un des types de séries temporelles les plus courants utilisés pour la régression. Si vous parvenez à modéliser l’évolution de la valeur d’une entreprise au fil du temps, vous pouvez prédire où elle se situera à l’avenir. Ce jeu de données provient également à l’origine d’une compétition publique Kaggle.
Dans cet exercice, vous allez tracer les séries temporelles de plusieurs entreprises afin de comprendre comment elles sont (ou ne sont pas) liées les unes aux autres.
Cet exercice fait partie du cours
Machine Learning for Time Series Data in Python
Instructions
- Importez les données avec Pandas (fichier
'prices.csv'). - Convertissez l’index de
dataendatetime. - Parcourez chaque colonne de
dataet tracez l’évolution des valeurs de la colonne dans le temps.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Read in the data
data = pd.____('prices.csv', index_col=0)
# Convert the index of the DataFrame to datetime
data.index = ____(data.index)
print(data.head())
# Loop through each column, plot its values over time
fig, ax = plt.subplots()
for column in ____:
data[column].plot(ax=ax, label=column)
ax.legend()
plt.show()