Sélection aléatoire de colonnes
Dans l’exercice précédent, nous avons examiné deux manières de sélectionner des lignes aléatoires dans un DataFrame pandas. Nous pouvons utiliser les mêmes fonctions pour sélectionner des colonnes au hasard dans un DataFrame pandas.
Pour sélectionner aléatoirement 4 colonnes du jeu de données de poker, vous utiliserez les deux fonctions suivantes :
- La fonction intégrée de
pandas.sample() - Le générateur de nombres entiers aléatoires de
NumPynp.random.randint()
Cet exercice fait partie du cours
Écrire du code efficace avec pandas
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Extract number of columns in dataset
D=poker_hands.shape[1]
# Select and time the selection of 4 of the dataset's columns using NumPy
np_start_time = time.time()
poker_hands.iloc[:,np.random.randint(____=____, ____=____, ____=____)]
print("Time using NymPy's random.randint(): {} sec".format(time.time() - np_start_time))