El problema del cumpleaños, una generalización
The birthday problem: an overview
Recibido: 16-07-07 Aprobado: 28-02-08
Resumen
El problema del cumpleaños, en el contexto clásico, se resuelve asumiendo una distribución de probabilidades uniforme discreta de los nacimientos. El propósito de este artículo es resolver el mismo problema bajo una distribución de probabilidades discreta arbitraria, y demostrar que bajo la distribución uniforme discreta, la probabilidad de que dos o más personas cumplan años en el mismo día es subestimada.
Palabras clave: combinatoria, probabilidad, distribuciones discretas, muestra aleatoria, Simplex.
Abstract
In the classic context, the birthday problem is solved assuming a discrete uniform probability distribution of births. The main purpose of this paper is to solve the birthday problem through an arbitrary discrete probability distribution and to prove that using discrete uniform distribution, probability of two or more people's birthday at the same date is underestimated.
Key words: combinatorial, probability, discrete distributions, random sample, simplex.
Introducción
El problema del cumpleaños se presenta de la siguiente manera, ver [2], [3], [4], [5]: Se supone que a una reunión asisten k personas, las cuales registran el día de su cumpleaños. Se pregunta: ¿cuál es la probabilidad de que dos o más personas, de las k asistentes, cumplan años el mismo día?
A cada fecha de cumpleaños se le asigna un número entero entre 1 y 365, no teniendo en cuenta el año bisiesto, por ejemplo si una persona cumple años el 25 de marzo entonces se le asignará el número 84 = 31 + 28 + 25.
En el siguiente análisis se asume que k < 365, pues en caso contrario se tendrá la solución trivial: probabilidad de que dos o más personas cumplan años el mismo día es igual a 1.
Este problema se resuelve utilizando el complemento del evento definido por "dos o más personas cumplan años el mismo día", es decir, calculando la probabilidad del evento "todos los k asistentes cumplen años en día diferente".
Planteamiento del problema clásico.
Sea Ω ={n∈N: 1 ≤ n ≤ 365} el espacio muestral, la sigma álgebra es = 2Ω el conjunto de partes del espacio muestral, y la medida de probabilidad P está definida, sobre los eventos simples unitarios, por.
El evento a medir es
Empleando argumentos de conteo, se encuentra que , donde es el número de permutaciones de tamaño k en el conjunto Ω.
De esta manera la probabilidad de que haya dos o más, de los k seleccionados aleatoriamente, que cumplan años el mismo día es
La siguiente tabla muestra los valores de la probabilidad P (Ac) para distintos valores de k.
Una de las preguntas de interés en este problema, ver [3] y [5], es determinar el menor número de asistentes tal que la probabilidad de que haya dos o más con el mismo día de cumpleaños sea por lo menos el cincuenta por ciento. En la tabla se ha resaltado esta probabilidad para un tamaño de 23 asistentes.
Problema del cumpleaños bajo distribución de probabilidades general
Sea X una variable aleatoria con valores en el conjunto finito A = {x1, x2, ..., xN}, y con función de probabilidad f. Sea X1, X2, ..., Xk, con k < N, variables aleatorias independientes e idénticamente distribuidas con distribución de probabilidades común f.
Proposición 1
La probabilidad p de que las k variables aleatorias X1, X2, ..., Xk, tomen todos sus valores distintos, dos a dos, está dada por:
donde Z denota los números enteros positivos.
Demostración
La probabilidad p de que estas k variables aleatorias tomen todos sus valores distintos es
Teniendo en cuenta que si I y J son dos permutaciones de (i1, i2, ..., ik), donde i1, i2, ..., ik son elementos de A distintos dos a dos, y en total hay k! permutaciones de éstos, entonces
de tal forma que,
debido a la independencia
y finalmente
Nota: Observe que el número de sumandos presentes en la sumatoria está dado por En particular, la solución al problema del cumpleaños, con n = 365, será:
considerando que se tiene una distribución uniforme sobre C= {1,2,3,...,365}, entonces para todo ij ∈ C y así
Proposición 2
Sean {x1, x2, ..., xN}un conjunto finito de números reales positivos, y k > 1, un número entero. Entonces
Demostración
Los casos extremos k = 1 y k = N se prueban fácilmente.
El caso k = 1 es directo ya que el lado izquierdo de la desigualdad anterior es x1 + x2 + ... + xN, mientras que el lado derecho es
El caso k = N se sigue de la desigualdad de media geométrica - media aritmética:
y de la identidad =1.
Demostración de los casos k: 1< k < N:
Sin pérdida de generalidad se puede asumir que , pues en caso contrario si , entonces basta definir las nuevas variables y se tendrá que , y
Se define la función g : → R, mediante
El dominio de la función es el conjunto cerrado y acotado {(x1,x2,...,xN)∈ : x1+x2+...+xN= N} y como g es una función continua entonces g alcanza máximo sobre S.
Sea z = (z1,z2,...,zN ) el punto en S donde g alcanza el máximo, el cual resulta único ya que el conjunto S es un simplex.
El máximo de g está en z = (1,1,...,1), en efecto:
Se supone, por el contrario, que existen i y j, i # j, tales que zi # zj y se considera el punto y∈S, definido por
decir, tiene las mismas coordenadas del punto z salvo que en las posiciones i-ésima y j-ésima están los promedios de las posiciones i-ésima y j-ésima del punto z.
Entonces
Entonces por la desigualdad de media geométrica-media aritmética, para dos componentes se tiene que:
Esta última desigualdad contradice que z = (z1,z2,...,zN ) sea el punto donde la función g alcanza máximo.
Por tanto z1 = z2 =...= zN , es decir z = (1,1,...,1), ya que
Proposición 3
El supuesto de distribución uniforme discreta de nacimientos para cada día de un año de 365 días subestima la probabilidad de que dos o más personas, de un conjunto de k personas con k < 365, cumplan años el mismo día.
Demostración
Bajo una distribución de probabilidades general, la probabilidad que todas las k personas cumplan años en días distintos es:
Sea , xi = ƒ (ir), r=1,2,...,k entonces de la proposición 2 se tiene que
Esta cota corresponde a la probabilidad dada por la distribución uniforme de nacimientos, así, la probabilidad de tener cumpleaños en días distintos es maximizada por la distribución uniforme que es equivalente a que la distribución uniforme subestima la probabilidad de que dos o más personas, de un conjunto de k personas con k < 365, cumplan años el mismo día.
Conclusiones
Literatura citada
BOYD, S. & VANDENBERGHE. Convex optimization, reprinted, Cambridge. U.K. 2006; 32-35.
DEGROOT M. Probabilidad y estadística. Adisson Wesley. Washington, 1999.
FELLER, W. An introduction to probability theory and its applications, vol. I, 3rd edition, Wiley and sons, New York, 1968; 33.
PARZEN, E. Teoría moderna de probabilidad y sus aplicaciones. Limusa, Noriega Editores. México D.F. 1993; 64.
SHIRYAEV, A. N. Probability. Springer GTM 95. 2nd edition. Berlin Heidelberg, 1996; 15.