jueves, 18 de octubre de 2012

INFORME Nº1: ANÁLISIS FALTANDO 8 FECHAS PARA EL TÉRMINO

Este blog fue creado con la finalidad de estimar cuál es la probabilidad  de clasificar al mundial Brasil 2014 de cada uno de los 9 países en competencia. Desde un enfoque netamente matemático-probabilístico, no futbolístico. Utilizando simulación matemática (método de Montecarlo), los resultados están resumidos en la siguiente tabla:         
                                          (hacer click sobre la tabla para agrandarla) 
Por si hay dudas sobre como leer la tabla pondré algunos ejemplos: la probabilidad que Argentina termine en 1º lugar es 55,9%, que Ecuador termine 4º lugar es 15,7%, que Chile termine en 9º lugar es 3,4%, etc.
La probabilidad de clasificación directa la lidera Argentina con 97,9%, luego Colombia con 89,6% y Ecuador con 87,1%.
Las mayores probabilidades de eliminación directa son: Paraguay con 90,2%, Bolivia con 86,6% y Perú con 84,5%.
Los equipos con mayor probabilidad de ir al repechaje son Uruguay, Venezuela y Chile (los 3 con probabilidad cercana al 21%). 
La probabilidad Total de ir al mundial la encabezan Argentina con 98,7%, Colombia con 92,7% y Ecuador con 90,9%. Más atrás le siguen Venezuela con 52,8%, Chile con 47,2% y Uruguay con 41,5%. En últimos lugares están Perú con 11,2%, Bolivia con 9,4% y Paraguay con 6,8%.    


La siguiente tabla analiza la probabilidad de clasificación directa de cualquier país que obtenga un determinado puntaje total, una vez finalizada las eliminatorias:
Con certeza matemática del 99,35%, clasifica directamente cualquier país que logre 27 puntos o más


Tengo un análisis adicional para mis compatriotas chilenos: 






NOTAS ACLARATORIAS:

1.- Cómo se realizan los cálculos?
El análisis está hecho completadas las 10 primeras fechas. Restan 8 fechas, con 4 partidos por fecha, en total quedan 32 partidos por jugar. Cada uno de esos 32 partidos tiene sólo 3 resultados posibles:  gana Local, Empate o gana Visita.
Es decir, 3^32 = 1.853.020.188.851.841 combinaciones de resultados posibles !
Para abordar esa cantidad estratoférica de combinaciones, se utiliza simulación matemática (método de Montecarlo). Se simula por computadora miles de escenarios posibles (en este caso 1 escenario equivale a simular los 32 partidos restantes), y en base a esos escenarios se sacan las conclusiones. La simulación toma como punto de partida la tabla actual de posiciones.

2.- La simulación toma en cuenta la diferencia de goles actual (Ejemplo: en la simulación si dos equipos terminaban empatados en 4º, el que tenía mejor diferencia de goles se consideraba 4º y el de peor diferencia de goles se consideraba 5º, haciendo la diferencia entre clasificación directa y jugar repechaje).

3.-                 Probabilidad Total de clasificar al mundial 
                                                     =
                         probabilidad de clasificación directa  
                                                    +
                         0,5  x  probabilidad de jugar repechaje 

Es decir, se asume que si un país debe jugar el repechaje, tiene la misma posibilidad tanto de ganarlo como de perderlo.

4.- Por qué  Colombia tiene mayor probabilidad de clasificar que Ecuador, si Colombia tiene un punto menos que Ecuador en la tabla? La respuesta es simple: es debido que la simulación asume mayor probabilidad que ganen los locales que las visitas, y uno de los 32 partidos faltantes  es Colombia - Ecuador.  Además Colombia tiene mejor diferencia de goles que Ecuador, hecho que queda reflejado en las probabilidades.
A algunos países le restan 4 partidos de local y 3 de visita, y en otros casos es al revés (3 de local y 4 de visita), eso influye en el resultado de la probabilidad. Este punto se detalla a continuación:

5.- Para el cálculo, sólo se necesita hacer un supuesto: en cada uno de esos 32 partidos  restantes, hay que establecer la probabilidad subjetiva a priori del resultado del partido (Local,  Empate o Visita). En lo personal  me decidí por utilizar el siguiente método:
probabilidad que en cada partido gane el equipo Local  =  50%
probabilidad que en cada partido exista un Empate  =  25%
probabilidad que en cada partido gane el equipo Visita  =  25%
Por qué?
El método es una aproximación razonable. La prueba es la siguiente: de los 40 partidos jugados hasta ahora (10 primeras fechas), 60% ha ganado el Local, 18% ha sido Empate y 22% ha ganado Visita. Es decir, 60%-18%-22% (realidad) v/s 50%-25%-25% (método teórico). Además es futbolísticamente lógico que el local tenga cierta ventaja.
La otra opción natural hubiera sido asignar 33,333% de probabilidad para Local, Empate o Visita por igual, un método "neutro". Sin embargo, si usaramos el método del 33,333%, los resultados obtenidos son similares, ya que  cada país disminuiría la probabilidad de ganar cuando juege de local (de 50% a 33,333%), pero aumentaría la probabilidad de ganar o empatar  (de 25% a 33,333%) cuando juege de visita, por lo que a grosso modo ambos efectos se anulan entre sí. A mi juicio, el método del 33,333% será más útil cuando resten  pocas fechas para el término de la eliminatoria (pues cuando queden sólo 1 o 2 fechas, hacer un juicio a priori favorable a los locales puede sobreestimar demasiado las probabilidades de clasificar de algunos países y subestimar la de otros).

Otra opción era calcular las probabilidades a priori de cada partido según el ranking FIFA de ambos países en cuestión. Pero ese ranking no tiene mucha validez que digamos. Otra opción era calcular las probabilidades a priori de cada partido según el rendimiento de las actuales clasificatorias de ambos países. Pero en ese caso condenaríamos a priori a los países colistas asumiendo que no tienen la capacidad de recuperarse, y a su vez estaríamos asumiendo que los países punteros no pueden empeorar su rendimiento (contraejemplos:  Uruguay y Chile iban primeros y ahora están 5º y 6º, por tanto rendimientos pasados no aseguran rendimientos futuros).


6.- A medida que vayan quedando menos fechas para el término de las clasificatorias, las probabilidades irán cambiando. La próxima actualización de los cálculos será en Marzo del 2013 (fecha en que se jugarán la úndecima y duodécima fecha).

7.- Todas las probabilidades fueron redondeadas en 1 dígito (ejemplo: 0,0% puede significar 0,02%).

8.- El número de iteraciones de la simulación Montecarlo está calibrado de tal forma que el máximo error posible es del +/- 0,5%. Por ejemplo, si la simulación arroja una estimación de probabilidad de 84,5%, la interpretación correcta es que  la verdadera probabilidad está entre 84,0% a 85,0% (en un intervalo de confianza del 99,8%). El 0,5% se refiere al máximo error entre  todas las probabilidades presentadas en este informe, sin embargo en algunos casos ese error es menor.