viernes, 7 de enero de 2011

La distribución de las probabilidades.

Ya que he aprendido a generar gráficas en Excel, voy a inundar el Blog de gráficas, son la forma mas visual de analizar las jornadas, se ve mucho mas claro que sólo con números.

Para eso primero tengo que explicar algunas cosillas y la principal es la de la distribución de las probabilidades de las columnas de la quiniela a partir de su tabla de porcentajes.

Ya he explicado que la probabilidad de una columna se calcula multiplicando las probabilidades de cada uno de sus 14 signos en tanto por uno.

Cada una de las 4.782.969 columnas posibles tiene su probabilidad calculada de esta manera y es distinta según la tabla con se se calcule.

Si calculamos las 4.782.969 probabilidades tendremos 4.782.969 números que se pueden analizar y es lo que vamos a hacer solo en parte aquí.

Como la probabilidad se calcula multiplicando, para analizar el conjunto de probabilidades de todas las columnas voy a usar el logaritmo de cada probabilidad.

Al usar los logaritmos resulta que las probabilidades de las 4.782.969 columnas tienen SIEMPRE una distribución NORMAL y se pueden representar gráficamente fácilmente (si se sabe, que antes no sabía, jeje), basta con calcular el promedio de los logaritmos de las 4.782.969 probabilidades y su desviación típica, estos dos datos definen completamente la curva de distribución.

Veámoslo con un ejemplo, la tabla de porcentajes apostados definitivos del LAE de la jornada 32:

84 11 05
08 13 79
72 20 08
37 33 30
59 26 15
93 04 03
39 33 28
81 13 06
62 25 13
86 09 05
68 21 11
37 41 22
28 34 38
48 32 20

Esta tabla se corresponde con una media de -20, 241 y una desviación típica de 3,138 y esta es su gráfica:


Si se toma la tabla LAE de la jornada 33...

52 27 21
18 16 66
80 12 08
75 16 09
35 29 36
14 15 71
51 27 22
36 36 28
13 18 69
25 31 44
65 22 13
76 16 08
42 37 21
79 13 08

Sale una media de -18,520 y una D.T. de 2,460, esta es su gráfica:


Una forma intuitiva de verlo es pensar en que cada columna es una gotita de agua con un número asociado, el conjunto de las 4.782.969 gotitas ocupan un litro y cada gotita se posiciona en la vertical de su probabilidad.

El litro de agua tiene siempre forma de campana y tiene siempre el mismo litro de agua, pero la forma de la campana cambia.

La jornada 32 fue fácil de pronóstico, la 33 ha sido normalita.

Cuanto más ancha y chata sea la distribución, más fácil es de pronóstico la jornada.

Cuanto mas estrecha y alta sea la campana mas difícil es de pronóstico.

3 comentarios:

Anónimo dijo...

Con respeto y sin afán de trolear, ahora que hablas de agua, recuerdo algo :


Vacía tu mente.
Libérate de las formas, como el agua.
Pon agua en la botella y será botella, pon agua en la tetera y será tetera.
El agua puede fluir o puede golpear.
Sé agua mi amigo.


Bruce Lee

Anónimo dijo...

Hola PacoHH!

Siempre dices que las probabilidades siguen una distribución NORMAL, pero yo no lo tengo tan claro... A mi me parece que la normal es simplemente una aproximación decente, pero hay otras distribuciones probabilísticas que se aproximan más a la realidad que esa.

Lo empecé a mirar, creo recordar que la que mejor cuadraba era la de Weibull de 3 parámetros, pero no me hagas mucho caso, que hablo de memoria, lo miré hace varios meses y lo dejé porque decidí tirar por otros métodos para hacer mis quinielas, ya no necesito saber la forma de la distribución. A lo mejor a ti te sirve más.

Un saludo! y gracias por compartir tu talento!!

PacoHH dijo...

Hay una manera imparcial de comprobar si la distribución es normal o no.

Dada una probabilidad dentro de una distribución NORMAL se puede calcular la posición ordenada (de mayor a menor probabilidad) que ocuparía la columna dentro de su distribución.

Por otro lado, completamente independiente en la forma de cálculo, hay utilidades de ordenar por probabilidad que ponen los 14 triples ordenados de probable a improbable.

Para cualquier columna con la que se pruebe, la diferencia de posición entre ambos cálculos es despreciable.

Eso a mí me demuestra que la distribución es realmente NORMAL a escala logarítmica.