Sélection de lignes et de colonnes dans les DataFrames pandas#

Souvent, il est logique de sélectionner certaines colonnes ou lignes pour notre analyse. Examinons comment nous pouvons le faire.

import pandas as pd

Pour cela, nous créons un dictionnaire avec des valeurs aléatoires et le transformons en tableau

data = {
    'A': [0, 1, 22, 21, 12, 23],
    'B': [2, 3, 2,  2,  12, 22],
    'C': [2, 3, 44,  2,  52, 52],
}

table = pd.DataFrame(data)
table
A B C
0 0 2 2
1 1 3 3
2 22 2 44
3 21 2 2
4 12 12 52
5 23 22 52

Sélection de colonnes#

Maintenant, nous pouvons sélectionner une ou plusieurs colonnes en les mettant sous forme de ‘chaînes’ entre [crochets] :

selected_columns = table[['B', 'C']]
selected_columns
B C
0 2 2
1 3 3
2 2 44
3 2 2
4 12 52
5 22 52

Sélection de lignes#

Maintenant, nous sélectionnons les lignes qui ont dans la colonne ‘A’ une valeur supérieure à 20 :

selected_rows = table['A'] > 20
table[selected_rows]
A B C
2 22 2 44
3 21 2 2
5 23 22 52

Nous pouvons également raccourcir ces deux lignes de code en une seule ligne. Voyez par exemple ici si nous voulons obtenir les lignes qui ont dans la colonne ‘A’ une valeur inférieure à 20.

table[table['A'] < 20]
A B C
0 0 2 2
1 1 3 3
4 12 12 52