CommencerCommencer gratuitement

Sélection aléatoire de colonnes

Dans l’exercice précédent, nous avons examiné deux manières de sélectionner des lignes aléatoires dans un DataFrame pandas. Nous pouvons utiliser les mêmes fonctions pour sélectionner des colonnes au hasard dans un DataFrame pandas.

Pour sélectionner aléatoirement 4 colonnes du jeu de données de poker, vous utiliserez les deux fonctions suivantes :

  • La fonction intégrée de pandas .sample()
  • Le générateur de nombres entiers aléatoires de NumPy np.random.randint()

Cet exercice fait partie du cours

Écrire du code efficace avec pandas

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Extract number of columns in dataset
D=poker_hands.shape[1]

# Select and time the selection of 4 of the dataset's columns using NumPy
np_start_time = time.time()
poker_hands.iloc[:,np.random.randint(____=____, ____=____, ____=____)]
print("Time using NymPy's random.randint(): {} sec".format(time.time() - np_start_time))
Modifier et exécuter le code