CommencerCommencer gratuitement

Mettre à jour l’index pour inclure février

Dans les deux exercices précédents, Sam a :

  • Lu les journaux quotidiens des demandes Get It Done pour février.
  • Les a combinés en un seul DataFrame.
  • Généré un DataFrame avec des métriques agrégées (nombre de demandes par type).
  • Écrit ce DataFrame dans des fichiers de rapport finaux au format CSV et HTML.
  • Téléversé ces fichiers sur S3.

À présent, elle souhaite que ces fichiers soient accessibles via la liste de répertoires. Pour l’instant, elle n’affiche que des liens vers les rapports de janvier : Screenshot of Get It Done reports listing

Elle a créé le client S3 boto3 et l’a stocké dans la variable s3.

Aidez Sam à générer une nouvelle liste de répertoires avec les rapports de février téléversés et à la stocker dans un DataFrame.

Cet exercice fait partie du cours

Introduction à AWS Boto en Python

Afficher le cours

Instructions

  • Listez les objets du compartiment 'gid-reports' commençant par '2019/'.
  • Convertissez le contenu de la liste d’objets en DataFrame.
  • Créez une colonne 'Link' qui contient l’URL publique de l’objet + sa clé.
  • Prévisualisez le DataFrame.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# List the gid-reports bucket objects starting with 2019/
objects_list = s3.____(Bucket='gid-reports', ____='2019/')

# Convert the response contents to DataFrame
objects_df = pd.____(objects_list['Contents'])

# Create a column "Link" that contains Public Object URL
base_url = "http://gid-reports.s3.amazonaws.com/"
objects_df['Link'] = base_url + objects_df['____']

# Preview the resulting DataFrame
objects_df.head()
Modifier et exécuter le code