Sélection aléatoire de colonnes
Dans l’exercice précédent, nous avons examiné deux manières de sélectionner des lignes aléatoires dans un DataFrame pandas. Nous pouvons utiliser les mêmes fonctions pour sélectionner des colonnes au hasard dans un DataFrame pandas.
Pour sélectionner aléatoirement 4 colonnes du jeu de données de poker, vous utiliserez les deux fonctions suivantes :
- La fonction intégrée de
pandas.sample() - Le générateur de nombres entiers aléatoires de
NumPynp.random.randint()
Cet exercice fait partie du cours
<cours>Écrire du code efficace avec pandas</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Extract number of columns in dataset
D=poker_hands.shape[1]
# Select and time the selection of 4 of the dataset's columns using NumPy
np_start_time = time.time()
poker_hands.iloc[:,np.random.randint(____=____, ____=____, ____=____)]
print("Time using NymPy's random.randint(): {} sec".format(time.time() - np_start_time))