CommencerCommencez gratuitement

Sélection aléatoire de colonnes

Dans l’exercice précédent, nous avons examiné deux manières de sélectionner des lignes aléatoires dans un DataFrame pandas. Nous pouvons utiliser les mêmes fonctions pour sélectionner des colonnes au hasard dans un DataFrame pandas.

Pour sélectionner aléatoirement 4 colonnes du jeu de données de poker, vous utiliserez les deux fonctions suivantes :

  • La fonction intégrée de pandas .sample()
  • Le générateur de nombres entiers aléatoires de NumPy np.random.randint()

Cet exercice fait partie du cours

<cours>Écrire du code efficace avec pandas</cours>
Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Extract number of columns in dataset
D=poker_hands.shape[1]

# Select and time the selection of 4 of the dataset's columns using NumPy
np_start_time = time.time()
poker_hands.iloc[:,np.random.randint(____=____, ____=____, ____=____)]
print("Time using NymPy's random.randint(): {} sec".format(time.time() - np_start_time))
Modifier et exécuter le code