miércoles, 22 de agosto de 2012

Las curvas del análisis semanal de rentabilidad

En primer lugar recomiendo leer lo que escribí sobre los "puntos".... que la gente suele sumar.

http://quinielandia.blogspot.com.es/2011/05/los-puntos-no-se-suman.html

http://quinielandia.blogspot.com.es/2011/05/los-puntos-no-se-suman-ii_18.html

http://quinielandia.blogspot.com.es/2011/05/los-puntos-no-se-suman-iii.html

Cuando se tiene una tabla de porcentajes y se analizan las probabilidades de todos los casos posibles, en este caso de 3^14 = 4.782.969 a escala logarítmica y se pasan a una gráfica aparece una distribución Normal (Campana de Gauss)

Siempre y para cualquier tabla de porcentajes aparece la campana de Gauss, lo que cambia de unas tablas de porcentajes a otras es la forma de la campana, voy a poner 2 casos:

1.- 14 partidos con 50 30 20 (campana Roja)

2.- 14 partidos con 70 20 10 (campana Azul)


El valor horizontal es el logaritmo de la probabilidad de cada columna y el vertical la densidad de probabilidad.

La superficie debajo de cada curva contiene las 4.782.969 apuestas en forma de gotitas microscópicas iguales, cuanta más alta es la curva quiere decir que hay más columnas con la misma o parecidísima probabilidad.

Si los partidos tienen 50 30 20 de probabilidad de cada signo, las probabilidades de las columnas están más agrupadas que si son 70 20 10, que están mucho más dispersas y hay millones de columnas que son menos probables que la menos probable de la distribución 50 30 20, cuando la curva roja llega a su punto más bajo a la izquierda, la curva azul es todavía alta y tiene mucho recorrido a su izquierda (menos probabilidad).

Si para la curva roja se aplican los porcentajes reales de esta jornada 01 y para la azul los del LAE definitivos salen estas curvas....


Si en la escala horizontal se ponen estimaciones de premio de 14 en lugar de probabilidades (recordar que Premio(14) = 0,06 / Probabilidad(14)), sale esta gráfica.


Ahora la gráfica está invertida, lo más bataro (probable) está a la izquierda.

Se ve que con los porcentajes Reales las columnas están mas agrupadas en premio, el punto más alto está en alrededor de 2.000.000 €, la mitad de las columnas de los 14 triples se merecen cobrar menos de 2.000.000 € y la otra mitad más de 2.000.000 €

Con los porcentajes LAE el punto más alto está por los 6.000.000 €.....

Si como en esta jornada lo máximo que puede cobrar el 14 es lo que ha cobrado el acertante único, 640.036 € y se pasa a la gráfica....



Lo que queda a la izquierda de la vertical negra y debajo de la curva azul son columnas de los 14 triples que en principio merecen ser apostadas porque tienen una estimación de premio de 14 con los porcentajes LAE inferior al premio máximo que se puede cobrar, la mayoría de las columnas de los 14 triples, derecha de la vertical negra por debajo de la curva azul, no merecen la pena ser apostadas porque se merecen cobrar más del máximo que pueden cobrar, para cobrar lo mismo mejor apostar más probable (izquierda)

Casi siempre la curva real es mas estrecha y alta que la del LAE, la mayoría de las columnas son realmente mas probables que lo que la gente apuesta, la curva roja es más alta por la zona izquierda que la azul, le diferencia de altura indica el despiste del apostante.

Por eso la quiniela es rentable.











30 comentarios:

Manu dijo...

Estupendo post, gracias por atender a mi peticion.

Me queda claro como el agua, y los 3 post sobre multiplicar y no sumar estupendos tambien...con lo que he sumado yo!

Anónimo dijo...

Gracias por tu interés.
pero he de decirte que creo que vas mal encaminado conceptualmente. Lo primero es que la quiniela, estadisticamente hablando, no sigue una distribución normal. Lo segundo, es que mezclas churras y merinas, haciendo que personas con poca o niguna formación, ver foro de losilla, te sigan y crean tener la piedra filosofal. Lo tercero, es que no debes olvidar el origen de la quiniela y su componente de azar. Todo ello hace que sea materialemnete imposible validar tu teoria, que por cierto vas variando cada año para mantener a tus fieles. En eso te pareces cada día más Takis el de timaMillones, aunque a tu favor juega la baza de que eres altruista y el otro se lo lleva a sacos.
No obstante, gracias por todo porque ello me anima a seguir en este juego que por momentos es apasionante. Todo ello te lo digo desde el máximo respeto a tu trabajo y a tus teorias. Saludos de un malacitano como tú.

PacoHH dijo...

Aunque estoy absolutamente seguro de que no va a servir de nada porque no vas a convencerte de lo que no quieres, tengo un excel que analiza la probabilidad apostada del 14 premiado sacada del escrutinio de las últimas 935 jornadas de quiniela, por este blog lo puedes encontrar.

La probabilidad de algo se mide como casos favorables/casos posibles, en este caso los casos favorables son los acertantes de 14 da cada jornada, los casos posibles el número total de apuestas realmente validadas, ambas cifras se pueden sacar de cada escrutinio.

Pues bien, el análisis de la probabilidad apostada de las 935 jornadas nos dice que la quiniela tiene también una distribución Normal a escala logarítmica.

O sea que lo primero de dices ya es estadísticamente falso porque los resultados sí siguen una distribución Normal.

Lo segundo, no puedo mezclar churras con merinas cuando solo hablo de dos cosas y las dos cosas son probabilidades, apostadas y reales.

Lo tercero, una distribución Normal de las probabilidades de los 14 premiados sacadas del escrutinio nos dice que la quiniela es un sorteo con bolas favoritas, cada signo tiene una probabilidad de salir distinta, el número de bolas que tiene en el bombo, yo en lugar de pronosticar procuro encontrar el número de bolas que tiene cada signo en el bombo.

Finalmente, esto que te estoy contando lo dije exactamente igual en 2.003 en el subforo de matemáticas de Losilla y allí todavía sigue, eso no es cambiar de teorías cada año, jeje.

Y sin acritud, un cordial saludo.







carlos dijo...

Cómo se sabe en qué parte de las campanas está nuestra columna ???
Perdón de antemano mi ignorancia, o esa respuesta es sólo para expertos...

PacoHH dijo...

En la entrada de "dos pájaros de un tiro"...

http://quinielandia.blogspot.com.es/2012/08/dos-pajaros-de-un-tiro.html

Tienes un excel con una combinación de 12.000 columnas, en las columnas "AX" y "AY" tienes la posición que ocupa cada columna dentro de los 14 triples si se ordenan por probabilidad real y apostada.

Si pulsas en cualquier casilla de esas columnas encontrarás la fórmula que lo calcula, está basada en la distribución Normal y tiene un pequeño margen de error que puede ser de 100 posiciones, despreciable.

PacoHH dijo...

Se me olvidaba, si rellenas columna ganadora de la jornada en las casillas "BL26-BL39", en las casillas
BS42 y BS43 aparece la posición que ocupa ordenada, variando la columna ganadora te va diciendo la posición que ocupa con los cambios.

Anónimo dijo...

Hola Paco, una pregunta, estas mismas gráficas que realizas para el Premio de 14, se podrian realizar de una manera igual de sencilla para el premio de 13?
(Teniendo en cuenta que la estimación del premio de 13 no es 100% fiable, pero me surge la duda de si se podría hacer). Un saludo Paco.

PacoHH dijo...

No es posible porque son 28 curvas distintas, cada columna es un 13 de 28 14´s distintos y tiene una estimación de premio de 13 distinta para cada uno de los 14´s.

Se podría hacer una media pero no la veo "útil"

Unknown dijo...

Si no he entendido mal entonces, las columnas susceptibles de ser selladas son aquellas que tienen un premio esperado real -Betfair- superior al premio esperado apostado -LAE- y que tienen un premio esperado menor que el umbral de bote. ¿Estoy en lo cierto? Un saludo Paco, si estoy equivocado en esta expresión me corriges por favor.

PacoHH dijo...

Al revés, son las que tienen un premio esperado BetFair inferior al esperado LAE, son las que se MERECEN (BetFair) un premio más bajo que el que se estima con los porcentajes LAE.

Cobran más de lo que se merecen y son rentables.

Hay que tener en cuenta que se reparte en premios el 55% de lo que se recauda y no basta que se merezca cobrar más, tiene que ser proporcionalmente más al "pellizco" que se lleva el LAE.

Lo del límite de bote sí es correcto, no es rentable una columna que se merece cobrar más de lo máximo que puede cobrar.

Unknown dijo...

Completamente de acuerdo, perdón por el error, a veces se me va la cabeza!!!. Yo tengo un programa de quinielas realizado por mi que administra las sorpresas o "no sorpresas" en base a una métrica y una calificación del partido desde muy casero a muy visitante en siete grados. Cuando lo hice por los noventa lo de Betfair me parece que no existía y yo sólo accedía a la información de sellado de Losilla, ni sabía que la LAE publicaba los porcentajes apostados. Esto es mucho más exacto y matemático, sorpresas y partidos de difícil pronostico hay, y claro que hay que apostar buscando esos signos porque salen y porque pagan, estando claro también que no hay que pasarse porque si no uno va hacia quinielas imposibles, que hay muchas -umbral de bote-. Todo el planteamiento me parece muy coherente y riguroso. Gracias por desarrollarlo.

PacoHH dijo...

A pesar de que son precisos al 100%, con los porcentajes de BetFair y LAE se cometen menos errores que clasificando de muy fácil a bomba los signos.

Los signos no dicen nada por ellos mismos, los números "retratan" mejor a los signos.

Las condiciones de la quiniela son "parches" para manejar signos, con números no se necesitan "parches", tienen "vida propia"



PacoHH dijo...

Errata, quiero decir que "A pesar de que NO son precisos...."

Unknown dijo...

El único problema es que nos quedan aun un buen montón de quinielas. Yo uso condicionadores y reductores por lo limitado de presupuesto, imagino que a todos nos pasa lo mismo, aunque sólo creo tiene cierto valor estadístico la esperanza de Xs, 2s y variantes que si me parece tienen un fundamento matemático, a las que aplico unos sigmas a ojo... (mas menos 2 signos). En realidad pronostico bastante, pronostico base y columna de fijos, por lo que tengo que "acomodar" las esperanzas antes mencionadas. A mi no se me ocurre mucho mas, considero que los demás condicionadores que hay no son de aplicación porque dudo mucho tengan el más mínimo fundamento matemático. Respecto los reductores, pues que remedio queda, me gustaría tener un cristalizador que tuviera en cuenta el valor esperado de las columnas.

PacoHH dijo...

A mí me da igual que una columna tenga 11 "X" que ninguna, los signos no existen, los sustituyo por 2 números para cada signo, su probabilidad apostada y su probabilidad real.

Hay herramientas que no necesitan nada más para generar "buenas" combinaciones.

Y buenas no quiere decir que acierten, quiere decir que AYUDAN a acertar cuando merece la pena acertar.

Con pequeños presupuestos acertar 14 es siempre y en todos los casos... suerte.

Unknown dijo...

Tengo una duda. Obviando tema de botes, si la esperanza de premio Betfair debe ser menor que la esperanza de premio LAE eso se cumple en la formula dada de la esperanza de premio -si es de aplicacion para Betfair y LAE-cuando la probabilidad de premio Betfair es mayor que LAE. Eso se cumple independientemente del 0,06 de la formula. No veo entonces que tiene que ver la forma de premiar del LAE con donde se debe apostar. Otra cosa sería si la esperanza de premio Betfair fuera directamente el inverso de la probabilidad de premio Betfair. Si no es así, independientemente de como se premie, donde se debe apostar es donde está infraapostado respecto Betfair. Tiene que haber algo mal en esto que estoy diciendo, hay algo que no entiendo y que tiene que ver con esta frase de Paco...

Hay que tener en cuenta que se reparte en premios el 55% de lo que se recauda y no basta que se merezca cobrar más, tiene que ser proporcionalmente más al "pellizco" que se lleva el LAE.

Paco, si me puedes echar una mano...

PacoHH dijo...

"Otra cosa sería si la esperanza de premio Betfair fuera directamente el inverso de la probabilidad de premio Betfair"

Es que ES eso

Premio 14(BetFair) = 0,075 / Probabilidad 14(BetFair)

Antes 0,06

Unknown dijo...

He hecho una pequeña aplicación para ver en el ejemplo que se nos pone, distribución de signos en los catoce triples igual a 50/30/20 en Betfair y 70/20/10 en ONLAE y he obtenido los siguientes resultados.

Columnas con probabilidad Betfair menor que probabilidad de bote, situado este en 750000 euros (probabilidad 0,0000001) 2717292 columnas. Estas serían columnas a desechar por ser de bote.

Siendo probabilidad Betfair mayor o igual que probabilidad de bote, dos casos.

Probabilidad ONLAE menor que probabilidad Betfair 1991301 columnas. Estas serían las columnas a apostar por estar infraapostadas respecto Betfair.

Probabilidad ONLAE mayor o igual que probabilidad Betfair 74376 columnas. Estas serían columnas a desechar por estar sobreapostadas respecto Betfair.

La suma de los tres paquetes de columnas dan las que corresponden a los 14 triples.

No se si tendré algún fallo de concepto aplicando la teoría, pero las columnas sobreapostadas son pocas 74376 en comparacion con todas las que cumplen probabilidad Betfair mayor que probabilidad de bote (1991301+74376).

Un saludo.

PacoHH dijo...

No he hecho esa prueba pero esos números no me parecen malos, ahora podrías hacerlo con los porcentajes que publico los viernes.....

Unknown dijo...

Sin problemas, el viernes que viene cojo tus números y ejecuto el programa. Un saludo y gracias.

Unknown dijo...

Estoy haciendo pruebas con el programita que me he hecho para entender bien estas teorías y he encontrado una cosa curiosa. Utilizo los datos del viernes pasado, Jornada 30 del 2014/2015 y umbral de bote 1050.000 euros.

1.- Hay quinielas que SI son de bote según ambas distribuciones. 3359718 quinielas.

2.- Hay quinielas que SI son de bote SOLO según Onlae. 680015 quinielas.

3.- Hay quinielas que SI son de bote SOLO según Betfair. 17564 quinielas, unas pocas pero hay, aquí es donde me he quedado sorprendido.

4.- Hay quinielas que NO son de bote según ambas distribuciones. 725672 quinielas.

Todas estas quinielas suman los catorce triples, son sucesos mutuamente excluyentes.

¿Cuales hay que considerar entonces como SI de bote, las que sean SI de bote en cualquiera de las dos distribuciones? ¿las que sean SI de bote en Onlae? Las que sean SI de bote en Betfair, cosa que descarto porque salen resultados de premios -otro módulo que tengo- aberrantes?

Hay aquí un pequeño paquete de quinielas en el cruce de las gaussianas que fastidia, me parece...

Un afectuoso saludo.

PacoHH dijo...

Las auténticas de bote son las que se calculan con los porcentajes LAE y te tienen que salir alrededor de 3.500.000 como mínimo.

Las que se calculan con los porcentajes BetFair son las que se MERECEN ser de bote, son habitualmente bastantes menos que las LAE.

En mis gráficas se ven perfectamente, curva (campana) azul clara LAE más baja y ancha que la verde clara (BetFair), la vertical negra de frontera de bote deja en la zona de bote mucha más superficie en la campana azul que en la verde.... habitualmente.

Hay 2 programas que calculan las probabilidades de las columnas y las ordenan.

La utilidad "Rangos" de Megaquin y la "Ordenar por probabilidad" del Free1X2


Unknown dijo...

Hola Paco, mi pequeña aplicación encuentra quinielas que NO son de bote ONLAE pero que SI merecen ser de bote BETFAIR, las 17564 columnas que menciono. Entre tanta quiniela es un tema anecdótico y además en la frontera de bote, macroscópicamente lo que dices y lo que digo cuadra perfectamente.

La semana pasada habría pues segun mi programita 4039733 (unos cuatro millones) de quinielas de bote, 525641 (un medio millón) de quinielas infraapostadas y 217595 (unas dos cientas mil) de quinielas sobreapostadas. Lo que si me dice mi calculador de premios es que algunas de las sobreapostadas son bastante valiosas, cosa estoy investigando. Muy interesante todo y divertido. Gracias y un saludo.

PacoHH dijo...

Esos números tienen toda la pinta de ser correctísimos, lo estás haciendo bien.

Unknown dijo...

Estoy ahora estudiando los premios. Sigo viendo cosas curiosas. A mi me sale que el sistema coge quinielas de poco valor absoluto económico por estar infraapostadas y descarta quinielas de bastante valor absoluto económico por estar sobreapostadas. Por ejemplo, coge una de 1400 euros infraapostada y descarta una de 1000000 de euros sobreapostada. ¿Puede ser eso así? El código es muy simple, estima quinielas de bote si probabilidad ONLAE menor que probabilidad de bote, de las que no cumplen la anterior condicion estima como infraapostadas aquellas que tienen una probabilidad ONLAE menor que probabilidad BETFAIR y las que quedan son sobreapostadas. Premio es 0,075 dividido por probabilidad ONLAE de la quiniela en cuestión. Eso si, en media las infrapostadas son más valiosas que las sobreapostadas, pero a mi me sale que el sistema descarta quinielas que son ciertamente valiosas a priosi por el hecho de que las estima sobreapostadas. Seguro estoy haciendo algo mal...

PacoHH dijo...

Creo que no lo haces mal, no puedo asegurarlo porque no lo veo.

Pero hay columnas muy caras que merecen serlo aún más y no son rentables, el premio no tiene nada que ver con la rentabilidad.

Y al contrario hay columnas muy baratas que merecen cobrar aún menos y son rentables.... las fáciles y rentables.



Unknown dijo...

Muchas gracias Paco. Es eso entonces, se me había olvidado ese concepto de que no es rentable lo infrapagado, por decirlo de alguna forma. Creo que absolutamente todo cuadra. La verdad es que entender todo esto tiene su tela... Un saludo.

Unknown dijo...

Una pregunta Paco, tienes alguna estadística realizada con los resultados sobre cuando la quiniela ganadora es infraapostada, sobreapostada o de bote?.

Entiendo perfectamente el sistema creo, y creo que lo entiendo porque también estudie algo de economía, maneja el concepto de valor real de las quinielas, que por supuesto incluye el riesgo y que por supuesto es influido por como paga ONLAE.

Muy interesante y curioso todo, te felicito por haber tenido estos pensamientos.

PacoHH dijo...

Creo que te servirá este excel que publiqué el varano pasado en esta entrada:

Estadística Coeficiente

Unknown dijo...

Tiene este excel que hace este gráfico?