martes, 10 de septiembre de 2013

INFORME Nº5: ANÁLISIS FALTANDO 2 FECHAS PARA EL TÉRMINO

@AlephEdu (en twitter)
Nota: este es el último informe. Quedan 2 fechas, y no tiene sentido hacer los cálculos para cuando quede una sola fecha (en ese caso será más sencillo analizar las posibilidades y combinaciones a mano)
Este blog tiene por objetivo estimar cuál es la probabilidad  de clasificar al mundial Brasil 2014 de cada uno de los 9 países en competencia. Desde un enfoque netamente matemático-probabilístico. Esto es similar a los comentarios deportivos con "calculadora en la mano", salvo que esta vez la calculadora es más sofisticada y precisa. Utilizando simulación matemática (método de Montecarlo), los resultados están resumidos en la siguiente tabla:




Lo más relevante de la tabla es ver para cada país, las probabilidades de clasificación directa, de ir al repechaje y de eliminación directa. 
Por ejemplo Chile tiene un 87,4% probabilidad de clasificación directa, un  12,6% probabilidad de ir al repechaje, y 0,0% de quedar eliminado directamente.

Las mayores probabilidades de Clasificación directa son:
100% Argentina
99,99% Colombia
87,42% Chile
63,04% Ecuador 
49,56% Uruguay



Resumen: 
1) Argentina tiene 100% asegurada la clasificación directa.
Colombia no está 100% clasificada directamente por una posibilidad: que pierda sus dos partidos por goleada, que Ecuador empate con Uruguay y además Uruguay golee a Argentina  y Ecuador golee a Chile. Resultaría un triple empate de 26 ptos , la dif. de goles definiría el 3°, 4° y 5°, y Colombia podría ir al repechaje.

2) Colombia y Chile  tienen asegurado en un 100% como mínimo ir al repechaje. 
Uruguay o Ecuador todavía tienen una remota probabilidad de quedar eliminado directamente.

3) Venezuela aún tienen una remota probabilidad de ir al repechaje: si Venezuela gana su único partido restante. Además Uruguay debe perder sus 2 partidos restantes o Ecuador perder sus 2 partidos. Con lo que habría un empate en 5to lugar con 22 ptos y la diferencia de goles sería crucial. 

4) Bolivia, Paraguay y Perú están matemáticamente eliminados.


Análisis más a fondo sobre Chile:

A Chile le quedan 2 partidos, c/u de ellos puede ganarlo, empatarlo o perderlo, es decir en total 3x3 = 9 escenarios posibles:




Conclusión: la situación de Chile es algo cómoda, pero la idea es clasificar directamente y evitar el repechaje. Como lo muestra la tabla hay algunas situaciones de riesgo. Por eso, lo ideal  para asegurar la clasificación sin depender de los demás resultados, sería  ganar al menos uno de los dos partidos, o empatar ambos (con 26 ptos Chile clasifica 100%).




NOTAS ACLARATORIAS:

1) Los resultados obtenidos utilizan los siguientes supuestos:

1A) El análisis está hecho restando 2 fechas, con 4 partidos por fecha, en total quedan 8 partidos por jugar. En cada uno de esos 8 partidos se asume 11 resultados posibles:
gana Local por 1 gol de diferencia
gana Local por 2 goles de diferencia
gana Local por 3 goles de diferencia
gana Local por 4 goles de diferencia
gana Local por 5 goles de diferencia 
Empate
gana Visita por 1 gol de diferencia
gana Visita por 2 goles de diferencia
gana Visita por 3 goles de diferencia
gana Visita por 4 goles de diferencia
gana Visita por 5 goles de diferencia 
Es decir, 11^8 = 214.358.881 combinaciones de resultados posibles.
Para analizar todas esas combinaciones posibles, se utiliza simulación matemática. La simulación toma como punto de partida la tabla actual de posiciones (incluida la diferencia de goles).

1B) En los 8 partidos restantes, se asigna igual probabilidad a que gane Local, Empate o que gane Visita (misma probabilidad de 33.3333% para L, E y V). Esto último equivale a enumerar todas las combinaciones de resultados posibles  de los partidos restantes, y calcular qué % de esos resultados permiten clasificar o no. 


1C) Se toma en cuenta la diferencia de goles. Se usa el reglamento oficial de la clasificación. 
primer criterio: puntaje total. 
segundo criterio: diferencia de goles.
tercer criterio: mayor cantidad de goles convertidos a favor.
Para obtener la diferencia de goles, en la simulación de los 8 partidos restantes se establece que cuando un equipo gana, lo puede hacer con una diferencia de 1 gol (1-0 , 2-1), de 2 goles (2-0 , 3-1) , de 3 goles (3-0 , 4-1), de 4 goles (4-0 , 5-1) o de 5 goles (5-0, 6-1). Y si hay empate es 0-0, 1-1 o 2-2. 
Alguien puede reclamar diciendo que un partido puede resultar 6-0, 9-4 o 4-4, pero es necesario  poner un límite razonable a las infinitas combinaciones (límite cálculo computacional). Además, la diferencia de goles tiene importancia sólo para el caso en que en la tabla final exista un empate de puntaje en el 4to y/o 5to lugar (para desempatar y decidir si hay clasificación, repechaje o eliminación).


2)                  Probabilidad Total de clasificar al mundial 
                                                     =
                         probabilidad de clasificación directa  
                                                    +
                         0,5  x  probabilidad de jugar repechaje 

Es decir, se asume que si un país debe jugar el repechaje, tiene la misma posibilidad tanto de ganarlo como de perderlo.

3) El número de iteraciones de la simulación Montecarlo está calibrado de tal forma que el máximo error posible es de +/-0,3%. Por ejemplo, la probabilidad de 84,5% significa que  la verdadera probabilidad está entre 84,2% a 84,8% (en un intervalo de confianza del 99,8%). El +/-0,3% se refiere al máximo error entre  todas las probabilidades presentadas en este informe, sin embargo en la mayoría de los casos ese error es menor a +/-0,1% ( o incluso error casi igual a 0%).

25 comentarios:

  1. Seria buena idea que publicaras el XLS con los resultados finales para ver las probabilidades de Colombia, Uruguay y Ecuador igual que como haces con Chile. Por lo demás, excelente analisis.

    ResponderEliminar
  2. Muy interesante, esto demuestra que la matemática brinda mas robustez para tomar decisión que la mera experiencia. De acuerdo a esto las personas ya pueden ir apartando su viaje para Brasil 2014.
    Hace un tiempo hice una parecida pero para determinar con cuantos puntos un equipo clasificaba.

    ResponderEliminar
  3. Lei esto, y me acorde de Lisa Simpson, cuando sacaba porcentajes y probabilidades de los partidos que dirigía de softball.

    Muy buen trabajo, felicidades.

    ResponderEliminar
  4. pero si chile hace 100 % con 26 puntos, mi pregunta es por q colombia no tiene el 100% si tiene 26 puntos ?

    ResponderEliminar
    Respuestas
    1. Porque los 8 partidos restantes están combinados de tal forma que con 26 ptos Chile clasifica en un 100%, pero con 26 ptos Colombia clasifica en un 99,99%
      (existe la posibilidad descrita que Colombia termine con 26 ptos en un triple empate. Esa posibilidad de triple empate con 26 ptos no existe matemáticamente para Chile, debido al fixture restante).

      Eliminar
    2. Si Chile hace 26 puntos....tanto Chile como Colombia clasifican directamente al mundial 100%, en primer lugar para que Chile haga 26 puntos debe empatar los dos partidos restantes...y Colombia sumaria minimo 27 puntos....un resultado lleva al otro...los 26 de Chile...son 27 minimo de Colombia.....dado que se enfrentan....

      Eliminar
    3. Si Chile finaliza con 26 ptos, Chile clasifica 100%
      Si Colombia finaliza con 26 ptos, Colombia no está 100%, sino que un 99.9%

      Eliminar
  5. Me parece que la decisión de aproximación por el método Monte Carlo esta mal tomada ya que no es una distribución uniforme y hay una variable mas importante que es la historia de los equipos en la eliminatoria (rendimiento local y visitante) y los resultados de los enfrentamientos que han tenido hace algunos años (X contra Y tiene un resultado favorable a X la mayor parte del tiempo).

    ResponderEliminar
    Respuestas
    1. Felicitaciones al autor del trabajo! Mi pregunta era justamente esa, si había utilizado una distribución uniforme para los 9 resultados posibles por match, lo cual sería un error . . .dicho esto, la simulación tipo Montecarlo no necesariamente asume la distribución uniforme.

      Eliminar
    2. Distribución uniforme, 33.333% para local, empate o visita, equivale a analizar todas las combinaciones posibles. Es un análisis neutral probabilístico, no futbolístico.

      Usar el rendimiento histórico no tiene sentido, y tiene un defecto grave: rendimientos pasados no aseguran rendimientos futuros. Si hace 4 años un país le ganó a otro de local, no significa que vuelva a ganar. Si es por rendimientos ... entonces no hagamos mundial de futbol y elijamos al campéon según el ranking fifa.

      Si usas por ejemplo 60% para local, 20% empate y 20% visita, estás dando favoritismo a priori al local. Con esa opción por ejemplo asumirías que Ecuador le gana probablemente a Uruguay y estarías dando por sentado que Ecuador clasifica y Uruguay va a repechaje.

      Eliminar
  6. Colombia NO HA CLASIFICADO AL MUNDIAL Me gusta el fútbol, y sin ser pesimista estamos en Colombia y todo puede pasar http://goo.gl/mu7wYY

    ResponderEliminar
    Respuestas
    1. Matematicamente no....pero una seleccion a dos fechas con 4 puntos de ventaja sobre el cuarto...de local con un tecnico que no ha cedido ni un punto de local....ni siquiera le han marcado gol en b/quilla...mas 13 goles y con dos rivales como Ecuadorar +1 y Uruguay -4...y con enfrentamiento directo entre estos dos....lo que significa que si empatan..en primer lugar no creo que Uruguay golee a Argentina y Ecuador un pesimo visitante golee a Chile un rival muy duro de local...y con mucho gol....se deben alinear todos los planetas con sus lunas....para que no solo Colombia sea goleado en 2 partidos...sino que se le den los resulatdos a los demas...me parece un absurdo pensar que no estemps en Brasil....mejor dicho es imposible el repechaje...

      Eliminar
    2. El analisis no puede ser mas serio y exacto. Felicitaciones. Yo ya habia estado hacienda calculos y no entendia por que el periodismo de mi pais no mencionaba lo poco probable que es ya una eliminacion. Pero ahora lo entiendo leyendo a mi compatriota pesimista: es una mezcla de supersticion e ignorancia. El colombiano tipico aprendio a siempre esperar lo peor por experiencias como la de la sub-20 en Londrina (0-9 contra Brasil cuando podiamos perder hasta por 8 goles) o por las eliminaciones en ultimos minutos en Copa Libertadores, etc. Pero, amigo, para eso son las matematicas; en esos casos lo unico que se necesitaba era que nos hicieran goles y esos siempre son probables. La probabildad de lo de Brasil, n se, hubiera sido 20 o 30%... Pero aqui se habla de 0.01% porque se tienen que dar una serie de eventos coincidencialmente al tiempo, todos dificiles. Todas tienen que ser goleadas y si no se da todo, no vale. Podemos perder por goleadas ambos partidos, pero si no empatan Uruguay y Ecuador y si Uruguay no golea a Argentina, etc, seguimos clasificando..... Es como la probabilidad de que a uno lo coja un carro, lo muerda un perro, lo pique una abeja y le caiga un asteroide, todo en la misma hora.

      Eliminar
  7. Una pregunta, la distribución de pérder/empatar/ganar es uniforme, pero la distribución de diferencia de goles también lo es? Es decir es igualmente probable cualquier resultado del partido?

    ResponderEliminar
    Respuestas
    1. Sí, la dif de goles tbn es uniforme. La idea era analizar todas las combinaciones posibles, y así poder concluir o descartar ciertas probabilidades del 100% o del 0% .

      Eliminar
  8. Otra cosas: segùn los parámetros (resultados posibles) de la simulaciòn, deberìa arrojar que Colombia està clasificada sin repechaje al 100%: si pierde sus dos partidos por 4 goles, su diferencia terminarìa en +5. Si Uruguay empata con Ecuador y le gana a Argentina por 4 goles, su diferencia serìa de +4.

    ResponderEliminar
    Respuestas
    1. Tambien me percaté de eso, si utilizaba sólo 4 goles máximo daba matematicamente clasificado a Colombia, cosa que no es cierta. Por eso que al final programé con un máxima diferencia 5 goles cada partido, sólo olvidé corregir la redacción del blog porque lo había escrito de antes.

      Si colombia pierde 5-0 y 5-0, queda con 26ptos y + 3 .Ecuador empata con Uruguay, luego Ecuador gana y queda con 26 +5 a +9 y Uruguay golea por 3,4 o 5 goles y queda con 26ptos +3,+4 o +5 => Colombia queda 5°

      Lo anterior es sólo para ilustrar que la clasificacion al 100% no es cierta, pero en la práctica es casi imposible que Colombia quede 5°.

      El error de tipeo ya lo corregí, gracias y saludos

      Eliminar
    2. Gracias a tí por compartir este excelente trabajo; por ahí un amigo te va a escribir solicitandote el excel para introducir probabilidades subjetivas. Un saludo desde Montevideo.

      Eliminar
    3. Estimado, como podríamos hacer para que nos puedas facilitar tu archivo excel.

      Eliminar
  9. Felicitaciones! Qué software utilizaste? Excel? Si es así, ¿podrías pasarme el documento? Para ver que tan sensible es a las probabilidades de cada partido.

    ResponderEliminar
  10. Como estadístico, le puedo decir que es un bog muy interesante. en mi tesis también trabajé con los métodos de simulación de Montecarlos y de verdad cada vez me sorprendo de la utilidad que estos tienen.

    ResponderEliminar
  11. Te felicito por este trabajo de simulación el cual sirve para motivar y estimular el estudio por esta hermosa herramienta.

    Saludos desde Colombia

    DC

    ResponderEliminar
  12. Excelente trabajo! Te felicito!!
    Solamente quería hacer una puntualización sobre este comentario que pones: "Venezuela aún tienen una remota probabilidad de ir al repechaje: si Venezuela gana su único partido restante. Además Uruguay debe perder sus 2 partidos restantes o Ecuador perder sus 2 partidos. Con lo que habría un empate en 5to lugar con 22 ptos y la diferencia de goles sería crucial"
    El triple empate es imposible ya que Uruguay y Ecuador enfrentan entre ellos por lo que alguno de los dos ya sumará más de 22 ptos. La posibilidad de Venezuela para alcanzar el repechage, es golear a Paraguay y esperar a que Ecuador o Uruguay pierdan sus 2 partidos (por cuántos más goles mejor).

    Saludos desde España

    ResponderEliminar
  13. Excelente trabajo! Te felicito!!
    Solamente quería hacer una puntualización sobre este comentario que pones: "Venezuela aún tienen una remota probabilidad de ir al repechaje: si Venezuela gana su único partido restante. Además Uruguay debe perder sus 2 partidos restantes o Ecuador perder sus 2 partidos. Con lo que habría un empate en 5to lugar con 22 ptos y la diferencia de goles sería crucial"
    El triple empate es imposible ya que Uruguay y Ecuador enfrentan entre ellos por lo que alguno de los dos ya sumará más de 22 ptos. La posibilidad de Venezuela para alcanzar el repechage, es golear a Paraguay y esperar a que Ecuador o Uruguay pierdan sus 2 partidos (por cuántos más goles mejor).

    Saludos desde España

    ResponderEliminar
  14. Hola, podrán hacer esta tabla de nuevo ahora que faltan 2 fechas para el mundial 2018? Gracias

    ResponderEliminar