Re: Una pregunta de tenis: ¿Misma probabilidad en cada set?...
Olvidad el párrafo de la bolsa del final (no debí meterme :P), me he dado cuenta de que he dicho más de una burrada, para empezar debería haber utilizado otro término diferente al de varianza, ya que estás (si no recuerdo mal) son siempre estrictamente positivas, nunca nulas. En fin, mis disculpas.
Re: Una pregunta de tenis: ¿Misma probabilidad en cada set?...
Citar:
Originalmente publicado por Galois
Olvidad el párrafo de la bolsa del final (no debí meterme :P), me he dado cuenta de que he dicho más de una burrada, para empezar debería haber utilizado otro término diferente al de varianza, ya que estás (si no recuerdo mal) son siempre estrictamente positivas, nunca nulas. En fin, mis disculpas.
No necesariamente, la varianza es nula en un conjunto de datos en los que se repite siempre el mismo valor. Es una tonteria, pero puede ser.
Volviendo a la pregunta del post. Con lo bonito que lo habias hecho, con sus demostraciones y probabilidades y no se te ha ocurrido plantear un test de hipótesis para responder a la pregunta. Hubieses quedado como un campeon
Vamos a ver si te vale este:
H0 = la probabilidad de ganar ambos sets es la misma
H1 = la probabilidad de ganar el primer set es diferente a la de ganar el segundo set.
Como lo vamos a comprobar?. Tomamos partidos y cuotas a ganar el primer set que indiquen una probabilidad de ganar el primer set de 70-80%
Vemos los % de primeros sets ganados, si está bien colocada la cuota estaremos hablando de 70-80% de partidos con el primer set ganado.
Vemos el % de esos mismos partidos en los que el resultado haya sido de 2-0. Y hacemos un test de dos proporciones para ver si hay diferencias. Es una sugerencia, no es la mejor, porque un test de 2 proporciones exige bastante cantidad de datos, pero es la más fácil de explicar.
El usuario siguiente agradece a buzjss por este post tan útil:
Re: Una pregunta de tenis: ¿Misma probabilidad en cada set?...
Hola buzjss, al comentarnos:
"No necesariamente, la varianza es nula en un conjunto de datos en los que se repite siempre el mismo valor. Es una tonteria, pero puede ser.".
Creo que has cometido el mismo error que yo, fijate por ejemplo en el caso de lanzar una moneda perfecta una sola vez y contar las caras, es decir una binomial de parámetros B(1, 1/2) (o una Bernoulli de parámetro 1/2, como lo quieras ver). Bien, en este ejemplo que te pongo tenemos un conjunto de datos con 2 elementos: el 0 correspondiente a 0 caras y el 1 correspondiente a 1 cara. En ambos se repite el mismo valor, es decir, 1/2. Pero la varianza no es 0, sino 1/4, ya que la varianza de una B(n,p) es n*p*(1-p)=1*(1/2)*(1/2) (en nuestro caso).
De todas maneras sí que hay un caso (que creo que es el único), en el que la varianza valga 0, sería el caso trivial, es decir, en el que el conjunto de datos se trata sólo de un único elemento (aquí no hay desviación que valga, pues sólo tenemos ese valor).
En cuanto a los tests de hipótesis, decirte que sí que lo había barajado internamente, pero por una mala experiencia personal (estudiando los over/under 2.5 goles en la liga japonesa de fútbol) y obteniendo resultados contradictorios según el test empleado, me hicieron darme cuenta, como poco, de que no tenía la suficiente experiencia ni habilidad a la hora de manejar este tipo de herramientas. Así que, por miedo personal a utilizarlos mal, intento evitarlos hasta más no poder :P.
En cuanto a tu test, sólo diré que me parece correcto ( e interesantísimo para mí propósito), pero permíteme que que me abstenga de dar más opiniones a parte de esta, sencillamente estoy verde en test de hipótesis.
Un saludo, y gracias por tu aportación, entre todos se puede hacer algo potente
Re: Una pregunta de tenis: ¿Misma probabilidad en cada set?...
Uhm, en cuanto al test, le acabo de ver una pega. Es un poco sutil, pero importante creo.
No se trata de ver si P(Ganar 1er. set) = P(Ganar el 2º set), sino
P(Ganar 1er. set)= P( {Ganar segundo set} | {Ganar el primer set} ) = P( {Ganar segundo set} | {Perder el primer set} ).
Si no tenemos esto en cuenta, dos casos completamente diferentes, se nos pueden colar en la misma hipótesis, te pongo un ejemplo:
Caso 1
Aquí es el caso fácil, supongamos que todos los sets del partido tienen la misma probabilidad de que los ganemos. Supongamos en este caso P( Ganar 1er. set) = P(Ganar el 2º set)=0.6
Caso 2
Supongamos ahora que, al igual que antes, la probabilidad de ganar el primer set es 0.6 (60%).
Ahora bien, a diferencia del caso 1, aquí el resultado del 1er. set va a influir sobre el 2º. Suponte por ejemplo que, si has ganado el 1er. set, ahora tienes un 70% (en lugar de un 60%), de probabilidades de ganar el segundo set. Suponte también que, si has perdido el 1er. set, ahora sólo tienes un 45% de probabilidades de ganar el 2º set.
Con estos datos, observa que aquí P({ganar el 2º set}) = ... =0.6*0.7+(1-0.6)*0.45=0.6, es decir, aquí también P({ganar el 1er. set})=P({ganar el 2º. set}) =0.6.
Es una pega que le encuentro al test, es decir, hayar la probabilidad de ganar el segundo set y que coincida con el 1º no me basta, he de hayarla en función de si has ganado o perdido el primero ya que, como en el ejemplo, podríamos determinar que son iguales, y eso no querría decir que hubiera independencia.
Por último, y sin que tenga nada que ver, disculpad mis constantes rectificaciones, son muchas las cosas que aprendo y comparto sobre la marcha y otras que no recordaba y he de reaprenderlas.
Re: Una pregunta de tenis: ¿Misma probabilidad en cada set?...
Una posible correción que se me ocurre sería:
H0=Probabilidad de ganar el primer set es la misma que la probabilidad de ganar el segundo set habiendo ganado el primero.
H1=Probabilidad de ganar el primer set es diferente de la probabilidad de ganar ganar el segundo set habiendo ganado el primero.
Luego habría que hacer un test similar en caso de derrota en el primer set.
De todas maneras releyendo tu post observo que nos comentas "Vemos el % de esos mismos partidos en los que el resultado haya sido de 2-0", por lo que si no te he entendido mal, comparas los que han ganado en el 1er. set con los que en el segundo set ganan sabiendo que han ganado el primero, así que quizás te referias a hacer este test en realidad.
Re: Una pregunta de tenis: ¿Misma probabilidad en cada set?...
Hola Galois, el placer es mío en poder cruzar una palabras contigo. Pero sin ánimo de ofender, creo que estás confundiendo las cosas.
La confusión está en no diferenciar las distintas probabilidades desde los distintos puntos de vista. La probabilidad del jugador A de ganar el 2° set antes del comienzo del partido no es la misma a la probabilidad del mismo jugador de ganar el 2° set luego de jugado el 1° set.
La probabilidad de ganar el 2° set varía según el punto de vista: 1) antes del inicio del partido y 2) después de jugado el 1° set.
Obviamente que la probabilidad de ganar el 2° set depende de los sucedido en el 1° set por muchos factores como por ejemplo la motivación de ganar el 1° set, lo que hace aumentar la probabilidad de ganar el 2°, pero a su vez la pérdida del 1° set haría disminuir la probabilidad de ganar el 2° set, con la consecuente neutralización de estas diferencias de probabilidades. Por lo tanto P(1° set) = P(2° set) desde el punto de vista del inicio de partido (sin haberse jugado aún el 1° set).
Pongamos un ejemplo para aclarar las cosas:
Si tengo en una bolsa 4 bolillas (2 rojas y 2 negras) y saco sin mirar una bolilla al azar, la probabilidad de sacar roja es de 50 % (2/4); y vuelvo a colocar la bolilla en su bolsa y retiro nuevamente, la probabilidad de sacar otra vez roja sigue siendo 50 %.
Entonces cada vez que retiro una bolilla tengo un 50 % de sacar roja. Son sucesos independientes.
Por lo tanto digo que la probabilidad de sacar roja en la 2° vez antes de sacar la 1° vez es la misma que después de sacar la 1° vez.
Bien, ahora que sucede, si al retirar la 1° vez , novuelvo a colocar la bolilla nuevamente en la bolsa, la probabilidad cambiaría, ya que la probabilidad de sacar una roja va a depender del color que saque en la 1° vez. Nos encontramos con sucesos dependientes.
Si la 1° vez salió un negra, la probabilidad de sacar una roja en la 2° vez es de 66,66% y si la 1° vez salió roja, la probabilidad de sacar roja en la 2° vez disminuye al 33,33%.
Ahora, pregunto ¿Cuál es la probabilidad de sacar una bolilla roja en la 2° vez sin aún haber sacado la 1° vez.?
Sería P = 0,50 * 0,66666 + 0,50 * 0,33333 = 0,50 = 50 %.
Por lo tanto, antes de empezar a sacar, la probabilidad de obtener una bolilla roja en la 2° vez es la misma que la 1° vez, aunque la 2° dependa de la 1°.
Espero haber sido claro.
Si tu intención es encontrar valuebets antes del inicio del partido, deberías tomar por válida la hipótesis de que la probabilidad de todos los set son iguales.
Pero si quieres encontrar valuebets, luego de jugado el 1° set, es lógico que la probabilidad no ha de ser la misma.
Te mando un abrazo.
Saludos.
El usuario siguiente agradece a Gekko por este post tan útil:
Re: Una pregunta de tenis: ¿Misma probabilidad en cada set?...
Amigo Gekko, para nada me ofendes, lejos de eso cada vez disfruto más posteando contigo.
Desgraciadamente, he de volver a discrepar contigo (al final tendremos que llamar a Cruyff para sacarnos de dudas jeje).
Antes de empezar, decir que tus cálculos son sencillamente perfectos, nada que objetar al respecto.
Tengo ahora dos discrepancias:
La primera de ellas consiste en que creo que simplemente estamos cálculando cosas distintas. Verás, yo no trato de averiguar si P( Ganar 1er. Set ) = P( Ganar 2º. Set ), al menos de momento. Lo que intento, es saber si el hecho de haber ganado el 1er. set influye en la probabilidad de ganar el segundo set (disculpa si antes no me había expresado convenientemente).
Reescrito en lenguaje matemático, quiero averiguar si P( G2 | G1) = P( G2 ), siendo G2={ Ganar el 2º. Set } y siendo G1= { Ganar el 1er. Set}.
O haciendo un símil de tu ejemplo de las bolas aplicado al tenis, trato de averiguar, si a la hora de ganar sets en el tenis, hay reposición o no (permíteme la metáfora, es para entendernos).
La segunda discrepancia tiene que ver con tu afirmación de que P(Ganar 1er. Set) = P(Ganar el 2º Set). Ojo, yo aquí no digo que no sea cierto, sólo digo que no se sabe.
En tu post, para ilustrarme el hecho de que siempre era así, me has dado un ejemplo en donde había una extracción de bolas de una bolsa.
Para que veas que no siempre tiene porque ser así, te propongo un ejemplo distinto, en el cual, no sólo extraeremos bolas, sino que también añadiremos, es el siguiente:
Imagina que tenemos en una bolsa 7 bolas blancas y 3 bolas negras.
Estaremos de acuerdo en que la probabilidad de sacar una bola blanca es 7/10 = 0.7 = 70%
Cogeremos después una bola de la bolsa, la miraremos, y la volveremos a meter.
Si la bola que viésemos fuera blanca, añadiremos otra bola blanca más y quitaremos una negra, quedando 8 bolas blancas y 2 negras.
Si por el contrario la bola que viésemos fuese negra, añadiremos otra bola negra y quitaremos una blanca, quedando 6 blancas y 4 negras.
Si nos preguntasen ahora, antes de ver incluso la primera bola, ¿cuál es la probabilidad de que la segunda bola que cojamos sea blanca?, la respuesta sería:
0.7*0.8+0.3*0.6=0.56+0.18=0.74
Observa por lo tanto, que la probabilidad de sacar la primera bola blanca era de 0.7 = 70%, mientras que la probabilidad de sacar la segunda bola blanca ya no es del 70 %, sino 0.74 = 74 %. Y observa además que en ambos casos estamos calculando las probabilidades antes de ver siquiera de que color era la 1ª bola.
De todas maneras, no se trata de poner ejemplos, ya que estos sirven para mostrarnos, no para demostrarnos.
Por lo tanto, yo no digo que la igualdad P(Ganar el 1er. Set) = P(Ganar el 2º. Set) sea falsa, sólo digo que no lo sé.
Intentando ahora que nos hayamos podido entender un poco mejor, recibe mi más cordial saludo.
Re: Una pregunta de tenis: ¿Misma probabilidad en cada set?...
Reflotando un poquito este post, quiero apuntar en lo comentado al tema que, sin haberlo comprobado estadísticamente, observo un porcentaje más alto de ganar el 3er set al jugador que ha ganado el 2º set.
Yo lo llamo "suele ganar el que viene detrás". Es algo así como el que viene en carrera o el que viene remontando. Supongo que también lo podemos extrapolar al fútbol, donde un equipo remonta tras ir perdiendo para acabar ganando, aunque a veces remonta y acaba empatando, por lo que el porcentaje no es absoluto.
En los partidos de favoritos, también observo que la probabilidad de ganar el 1er set de los no-favoritos es mayor que la de ganar el 2º set. Esto es así porque cuando un jugador débil pierde el primer set, normalmente disputado, como dijo alguien "parece que haya perdido a su mamá" y se desentiende del partido. Así que el luchar para ganar el 2º set es más complicado que salir de inicio a dar guerra y poder llevarse el primer set.
Supongo que ambas observaciones responden a factores psicológicos, tales como la moral tras remontar 1 set o el espíritu de superación y lucha tras perder el primero, por lo que las probabilidades de ganar cada set dependen de los factores mentales del jugador. Un luchador peleará por ambos sets, o un jugador que defienda puntos, o un jugador que quiera agradar, y un jugador que está de paseo peleará el primero y el segundo estirará un poquito para que no le den tirones y poco más.
Editado por Laurent Jalabert, 21/10/2008 a las 04:51 AM
El usuario siguiente agradece a Laurent Jalabert por este post tan útil:
Re: Una pregunta de tenis: ¿Misma probabilidad en cada set?...
Gracias por tu respuesta Laurent Jalabert, y disculpa que no te haya contestado antes, hacia tanto que no había respuestas en el hilo que ya no lo miraba, y se me pasó por completo.
Entrando al trapo, te diré lo que una primera estadística me ha sugerido a mi:
"Ganar un set, afecta positivamente al que gana, sea favorito o no favorito."
(De paso te diré también, que de media afecta positivamente entre un 10,5% y un 11% a la hora de afrontar el siguiente set).
Lo cual coincide con tu observación de que "observo un porcentaje más alto de ganar el 3er set al jugador que ha ganado el 2º set".
Yo había achacado ésta observación a otras causas que no comentaré (por falta de tiempo), pero lo bueno de la estadística es que no hace falta saber el porque ocurre algo, sólo constatar que ocurre.
De todas maneras he de advertirte de que mi análisis estadístico aún es muy incompleto, no sea que tomes lo que digo como una verdad absoluta. Aunque las primeras conclusiones coinciden con lo observado por ti.