miércoles, 9 de agosto de 2023

Estudio de BetFair cercano al cierre (III)

Ampliando datos  del fichero que estudia las cuotas BetFair cercanas al cierre con partidos de todo el mundo que puse aquí:


Ya son nada menos que 16.803 partidos en los que no se juega en campo neutral y el de casa juega en casa y sin partidos amistosos.

Incluye un análisis mas completo de los datos, como por ejemplo ver lo que se ganaría o perdería apostando 2 € (casilla A1) en cada uno de las 6 posibles apuestas en cada partido (3 a favor del signo y 3 en contra) está en las columnas CA-CF, a la larga se pierde con todo.

Eso indica que las cuotas que salen del "mercado" BetFair tienen un error inferior al 2% que es la comisión que cobra BetFair al que gana cada apuesta.

Se puede analizar por banda de cuotas en las columnas CI - DE  modificando los valores de las casillas CI16809 y CJ16809, que tienen por defecto un 1,3 y 1,5 respectivamente.

Analizando globalmente las cuotas se ve que los porcentajes que salen de ellas se quedan de media un poco mas bajos respecto a los resultados que salen, las columnas N, O y P contienen los porcentajes que salen de las cuotas y los de las columnas W, X e Y los valores "rectificados" que hacen que entropía e Información sean parecidísimos.

Globalmente como menos se pierde es apostando en contra de la "X", casilla CD16806.

Está aquí:


Otro dato que se puede sacar de la tabla...

¿Cuántos goles son los más probables que marque el equipo de casa cuando tiene una probabilidad del 58% de ganar.....? -> 1,804 casilla BD16868

?Y si es el visitante el del 58%....? -> 1,844 casilla BP16838

2 comentarios:

Juan Carlos Perez Pulido dijo...

En 5 palabras: ES PEC TA CU LAR.
Muchísimas gracias por compartir esta información. Intetaré compartirte todo lo que vaya extrayendo. Para empezar he aplicado chi cuadrado que es un medidor más adecuado que la entropía/información para evaluar la bondad de ajuste. Los ajustes son tan buenos que, cómo dices, el mercado 1X2 no es rentable de ninguna manera, otra cosa sería combinándolo con número de goles u otra cosa.
Tus "rectificadas" ajustan mejor, pero hay un poco de "trampa" ya que utiliza los resultados reales de todos los partidos para evaluar todos los partidos. Aquí lo adecuado sería (ya que hay partidos de sobra) coger unos cuántos partidos para construir las rectificadas y utilizar otros para evaluar la bondad de ajuste. Por cierto, en los enormes "carros" de potencias que utilizas para hacer las rectificadas me pierdo, no sé que regla estás utilizando para "construir" las rectificadas.
Otra cuestión que he descubierto es que el ajuste es tan fino que influye hasta el margen en la cuota que permite la casa de apuestas, por ejemplo la cuota puede ser 1,38 o 1,39, pero no entre medias. Eso afecta a la hora de normalizar los porcentajes al 100% ya que cada cuota tiene un margen de variación diferente.
Por último (de momento), un pequeño ajuste, la fila 3727 estaba oculta y no constaba el resultado del partido (Es un Empoli-Bologna que acabó 2-1).
Un saludo y gracias de nuevo. Te agradecería también que me indiques de alguna manera si lees este comentario.

PacoHH dijo...

El Excel tiene 2 objetivos:

Por un lado calcular la probabilidad más fiable de que salga cada signo "1", "X", "2" en un partido de futbol a partir de lo que se apuesta en las casas de intercambio, que por cada signo tiene 2 cuotas.

1,38 significa que en la "mesa" se ponen 1,38 €, alguien ha puesto 0,38 € esperando que otro ponga 1 € para cerrar a apuesta. (apuesta "a la contra") €

1,39 significa que en la "mesa" se ponen 1,39 €, alguien ha puesto 1 € esperando que otro ponga 0,39 € para cerrar a apuesta. (apuesta "a favor")

Hay apostantes que sí han apostado 0,38 € esperando ganar 1 € y nadie lo acepta, pero no hay nadie que por 1 céntimo más, 0,39 €, se arriesgue a ganar el € que ya le ofertan.

Para mí la frontera está en 0,385 y su inversa es la probabilidad de que salga el signo. lo dice el "mercado".

Luego en mi excel analizo el "mercado" y me sale que se queda un poco corto en su valoración, para aproximarlo aún más uso la "estimación lineal de 10º grado", la curva polinómica que se aproxima más a los puntos que representan cada muestra.

Por otro lado busco los goles más probables que se van a marcar a partir de las mismas cuotas, también usando las estimación lineal sale un valor decimal, que aplicando Poisson da la probabilidad de que se marque cualquier número de goles.

Gracias por lo del Empoli_Bologna, ya está arreglado.