miércoles, 20 de febrero de 2008

El peso de una moneda


Terminó nuestra encuesta Respuestas azarosas. Os recordamos su "enunciado":

"Lanza una moneda. Si sale cara, marca "Sí". Si sale cruz, responde sinceramente: ¿alguna vez has simulado una enfermedad para no ir a trabajar?"

Finalmente los resultados han sido:

Personas que respondieron: 60
Número de respuestas "Sí": 48
Número de respuestas "No": 12

Número estimado de caras: 30
Número estimado de cruces (y, por tanto, número de respuestas supuestamente sinceras): 30

Por tanto, si a las 48 caras restamos las 30 supuestamente debidas al azar, nos quedan 18. Así el porcentaje estimado de síes (personas que supuestamente alguna vez han simulado una enfermedad para no ir a trabajar) sería:

18/30 = 60%

Interrogantes que (me) planteo:

-Media hora antes de terminar el plazo de la encuesta había 59 respuestas y no este redondo y cómodo 60. ¿Cómo evaluamos el número de caras con un resultado impar como 59?
-¿Es 60 un número suficiente para estimar un 50% de caras?
-En mi opinión lo más difícil: ¿cómo estimamos el número de personas que no han lanzado la moneda pero sí han respondido? (perfil que parece lógico que haya existido)

3 comentarios:

Acido dijo...

"-En mi opinión lo más difícil: ¿cómo estimamos el número de personas que no han lanzado la moneda pero sí han respondido? (perfil que parece lógico que haya existido)"

Esto es un problema grande: porque significaría que aunque hemos contabilizado 18 sí sinceros, podrían haber sido 20 sólo que hemos descontado 2 como 2 síes de puro azar.

La variante sería "si sale cara, lanza la moneda de nuevo y marca sí o no dependiendo de la moneda"

Hay que tener en cuenta que esto también elimina un problema: los que responden "SÍ" se están poniendo en sospecha mientras que los "NO" están dejando claro que dicen la verdad (un "NO" suponemos que es sincero, no tiene la excusa de haberlo dicho por la moneda)

Con este método restarías 1/4 de los votos en cada resultado y tendrías la proporción. (Con un poco de suerte tienes más de 15 en cada caso). Ej: sí=40, no=20... restamos 15 y son : sí=15, no=5

-¿Es 60 un número suficiente para estimar un 50% de caras?
La teoría estadística nos da una forma de estimar esto. Lanzar una moneda es un experimento de Bernouilli y su repetición se modela como una Binomial.
http://es.wikipedia.org/wiki/Distribuci%C3%B3n_Binomial
Con la Binomial calculamos la probabilidad de que el número de caras sea el 50% y también podemos calcular sigma: un margen de error... error que no cometeremos en el 60% de los casos... o 2*sigma, error que no cometeremos el 95% de los casos.

sigma^2 = 60*1/2*1/2 = 15
entonces sigma es menos de 4.
En el 60% de los casos, el error es menos de 4: suponemos que el número de caras es 30 pero oscila entre 26 y 34 el 60% de las veces.
Usando 2*sigma: oscila entre 22 y 38 el 95% de las veces.
(no es mucha confianza, la verdad)

Juan Luis dijo...

Gracias, Ácido. No, efectivamente no es mucha confianza...

Tampoco es que las encuestas "normales" tengan tanta fiabilidad, pero me parece interesante analizar esta. En cuanto a los que no han lanzado la moneda, supongo que la única forma de estimarlo es tener información de experiencias previas parecidas.

Acido dijo...

Algunas puntualizaciones:

Donde dije 60% en realidad debí haber dicho 68%. Aún así, 68% y 95% son cifras relacionadas con la Distribución Normal (también conocida como Gaussiana, campana de Gauss). En este caso la distribución no es Gaussiana, pero usar una Gaussiana y sus números no es muy incorrecto, ya que una binomial se aproxima a una gaussiana.

Por otro lado, calculo la probabilidad de que el número de caras sea exactamente 30:

Prob_Binomial(30,60,1/2)=
=COMB(60,30)*(1/2)^30*(1-1/2)^(60-30)=COMB(60,30) / 2^60

2^60 = 1152921504606846976

COMB(60,30)= 118264581564861420

prob(30 cruz)=0,10257817300856951

(poco más de un 10%)

Igualmente podemos calcular otras probabilidades.

Prob(29)=Prob(31)= 0,0992692
Prob(28)=Prob(32)= 0,0899627
Prob(27)=Prob(33)= 0,076332
Prob(26)=Prob(34)= 0,0606166


Aprox: 10,2% + 2*10% + 2*9% + 2*7,6% + 2*6% =
= 75,4 %
(algo más del 68%)

Es decir, 3 de 4 veces (75%) el error cometido es de 4 ó menos.
Y sólo 1 de cada 10 (10%), acertamos al escoger 30 como el número de caras.


DISEÑANDO UNA NUEVA ENCUESTA
Supón que quieres tener la confianza de que el 95% de las veces el error sea menor del 5% (en el caso anterior es el 26% = 8/30)
El Error es 2*sigma
Y queremos Error / media = 5/100

2*sigma = raiz(n)
media = n/2

Error / media = 2/(raiz(n))

media / Error = raiz(n)/2=100/5
raiz(n)=40

Así que n=1600

Si en lugar de tener 60 hubieses tenido 1600, sigma = 20, 2*sigma = 40 ... 40/800 = 5%

Sí, 1600 es mucho.