Lire du HTML
Examinez l’extrait suivant d’un site web :
Le web scraping, c’est cool
Il consiste à écrire du code – en R ou en Python.
DataCamp propose des cours à ce sujet.
Le HTML correspondant vous est fourni dans la variable
html_excerpt_raw.
Dans cet exercice, vous allez utiliser rvest pour le lire dans R afin de pouvoir le manipuler.
Comme vous utiliserez le package rvest tout au long de ce cours, il aura toujours été préchargé pour vous avec la commande library(rvest).
Cet exercice fait partie du cours
Web scraping en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
html_excerpt_raw <- '
Web scraping is cool
It involves writing code – be it R or Python.
DataCamp
has courses on it.
'
# Turn the raw excerpt into an HTML document R understands
html_excerpt <- ___
html_excerpt