Ayer comencé a trabajar con data de la Serie Nacional de Cuba. Como primer paso escribí un código capaz de descargar información del sitio http://www.beisbolcubano.cu. Acá se los dejo por si alguien quiere jugar con él. No es perfecto, pero sirve. Utilícenlo con precaución, recuerden que fue creado con fines de estudio. Ami en lo personal, me servirá para calcular la Expectativa de Carrera. Dudas por DM en Twitter o comentando en este post.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
from bs4 import BeautifulSoup | |
import requests | |
def obtenerContenido( id_partido ): | |
pagina = f"http://www.beisbolcubano.cu/estadisticas/BoxScore?idJuego={id_partido}" | |
peticion = requests.get(pagina) | |
contenido = BeautifulSoup(peticion.content, 'html.parser') | |
return contenido | |
def obtenerDataDePartido( contenido ): | |
data = { "inning" : [], | |
"equipo" : [], | |
"pdi" : [], | |
"eventos": [], | |
} | |
i = 0 | |
for c in contenido.find_all("li", {'class' :"contenedorCalendarioInt"} ): | |
if i % 2 == 0: | |
data['pdi'].append('top') | |
else: | |
dic['pdi'].append('bottom') | |
i += 1 | |
data['inning'].append( c.find("h2").text.replace("|","").replace(" Inning ","").replace("9999","9") ) | |
data['equipo'].append( c.find("h2")['class'][0] ) | |
# Eventos que ocurren durante el inning | |
for e in c.find_all("span", {'class' :"sede"} ): | |
data['eventos'].append(e.text) | |
return data | |
contenido = obtenerContenido(2) | |
data = obtenerDataDePartido(contenido) |
El lenguaje utilizado aca es Python:
Me gustaMe gusta