In [1]:
### Importando las librerias
In [2]:
import pandas as pd
In [3]:
datos = pd.read_csv("data/atp.csv" , encoding="ISO-8859-1") #aqui se usa condicion encodig
print(datos.head())
Aqui generamos un index (indice, ID) en una columna determinada. En este caso Location¶
In [4]:
datos.set_index("Location", inplace = True)
En la columna seleccionamos solo un grupo de datos. una lista.¶
In [5]:
dat = datos.loc["Doha"]
dat.to_csv("data/doha.csv")
In [6]:
dat = datos.loc["Miami", "Winner"]
dat.head()
dat.to_csv("data/Winner.csv")
Ejercicio: hacer una tabla con los ganadores en Adelaide, por año y superficie¶
Aqui generamos una serie de listas pareadas. en este caso una primera por el index, y las otras en funcion de lo que se quiere por columna¶
In [7]:
print("Ganadores en adelaide por fecha")
dat = datos.loc[["Adelaide"], ["Date", "Winner"]]
print(dat.head(100))
dat.to_csv("data/Winner.csv")
Aqui, con mas campos¶
In [8]:
dat = datos.loc[["Adelaide"], ["Date", "Winner", "Loser"]]
print(dat.head(100))
dat.to_csv("data/Winner.csv")
Aqui hacemos selecciones por rango, desde una columna A a la B¶
In [9]:
dat = datos.loc[["Atlanta", "Melbourne"], "Series" : "Loser"]
print(dat.head(100))
dat.to_csv("data/Winner.csv")
In [10]:
print ("Solo Gran Slam")
dat = datos.loc[datos["Series"].str.endswith("Slam")]
dat.to_csv("data/Winner.csv")
Ejercicio: hacer un dataset de los campeonatos International Gold, por ganador y perdedor y por fecha.¶
In [11]:
dat = datos.loc[datos["Series"].str.endswith("Gold")]
dat.to_csv("data/Winner.csv")
datos = pd.read_csv("data/Winner.csv" , encoding="ISO-8859-1")
datos.set_index("Location", inplace = True)
print(dat.head(100))
dat = datos[["Date", "Winner", "Loser"]]
dat.to_csv("data/Winner.csv")
In [12]:
dat = datos[["Tournament", "Date", "Winner", "Loser"]]
dat
Out[12]: