Seleccionando filas y columnas en DataFrames de pandas#
A menudo, tiene sentido seleccionar ciertas columnas o filas para nuestro análisis. Veamos cómo podemos hacerlo.
import pandas as pd
Por lo tanto, creamos un diccionario con valores aleatorios y lo convertimos en una tabla
data = {
'A': [0, 1, 22, 21, 12, 23],
'B': [2, 3, 2, 2, 12, 22],
'C': [2, 3, 44, 2, 52, 52],
}
table = pd.DataFrame(data)
table
| A | B | C | |
|---|---|---|---|
| 0 | 0 | 2 | 2 |
| 1 | 1 | 3 | 3 |
| 2 | 22 | 2 | 44 |
| 3 | 21 | 2 | 2 |
| 4 | 12 | 12 | 52 |
| 5 | 23 | 22 | 52 |
Seleccionando columnas#
Ahora podemos seleccionar una o más columnas poniéndolas como ‘strings’ entre [corchetes]:
selected_columns = table[['B', 'C']]
selected_columns
| B | C | |
|---|---|---|
| 0 | 2 | 2 |
| 1 | 3 | 3 |
| 2 | 2 | 44 |
| 3 | 2 | 2 |
| 4 | 12 | 52 |
| 5 | 22 | 52 |
Seleccionando filas#
Ahora estamos seleccionando filas que tienen en la columna ‘A’ un valor mayor que 20:
selected_rows = table['A'] > 20
table[selected_rows]
| A | B | C | |
|---|---|---|---|
| 2 | 22 | 2 | 44 |
| 3 | 21 | 2 | 2 |
| 5 | 23 | 22 | 52 |
También podemos acortar estas dos líneas de código en una sola línea. Vea por ejemplo aquí si queremos obtener las filas que tienen en la columna ‘A’ un valor menor que 20.
table[table['A'] < 20]
| A | B | C | |
|---|---|---|---|
| 0 | 0 | 2 | 2 |
| 1 | 1 | 3 | 3 |
| 4 | 12 | 12 | 52 |