Usando comandos básicos de Pandas¶
In [1]:
import pandas as pd
import numpy as np
generando un dataframe con numeros aleatorios, en 4 campos y 120 entradas¶
In [2]:
OP = pd.DataFrame(np.random.rand(120,4))
OP
Out[2]:
Del anterior DataSet visualizar n primeras filas¶
In [3]:
OP.head(7)
Out[3]:
Mostrar ultimas n filas¶
In [4]:
OP.tail(7)
Out[4]:
Número y tipo de filas y columnas¶
In [5]:
OP.info()
In [6]:
OP.describe()
Out[6]:
Valores únicos para todas las columnas¶
In [7]:
OP.apply(pd.Series.value_counts)
Out[7]:
Renombrar columnas¶
In [8]:
OP.columns = ["a", "b", "c", "d"]
OP
Out[8]:
mas informacion¶
https://www.dataquest.io/blog/pandas-cheat-sheet/?utm_source=Dataquest+Blog+Subscribers&utm_campaign=905c386f3f-Blog_Post_2017_02_21_pandas_cheat_sheet&utm_medium=email&utm_term=0_9436fa3dc8-905c386f3f-150782837
En el caso de que se tenga una entrada, pero varios index estos se escalan¶
In [9]:
s = pd.Series(5, index=[0, 1, 2, 3])
s
Out[9]: