Algo contrario a la intuición, a medida que aumenta el número de familias, la proporción esperada de niños a niños totales tenderá exactamente a la mitad, aunque la expectativa nunca será exactamente 1/2 en muestras finitas. (Siempre es un poco por encima de 1/2.)
La respuesta oficial dada por Google (citada en http://mathoverflow.net/question…) – que la proporción esperada es exactamente 1/2 – es incorrecta, al igual que su razonamiento para la respuesta [1]. Sin embargo, 1/2 es básicamente una respuesta razonable. Primero daré una explicación de esa respuesta que se basa esencialmente en todas las interpretaciones de la pregunta, y luego explicaré por qué no es la respuesta exacta en poblaciones finitas a la pregunta formulada anteriormente. (Me disculpo por el carácter un tanto descuidado de esta respuesta. Hay muchas perspectivas sobre el problema que quiero mencionar, pero su organización aquí está lejos de ser óptima).
La distribución que describe cuántos hijos tiene hasta el primer macho (inclusive) es la distribución geométrica con el parámetro p = 1/2 (http://en.wikipedia.org/wiki/Geo…) [2]. La media de esta distribución es 2 (y la varianza es igual a 2). Por lo tanto, el número medio de hijos por familia es 2. Según el Teorema del límite central, sabemos que a medida que el número total de familias n aumenta, el número total de niños será muy cercano a 2 n , el doble del número de familias . (El error en esta estimación será de orden [math] \ sqrt {n} [/ math], que es insignificante en relación con el número total de personas cuando n es grande). Por ejemplo, si tenemos 10,000 familias, entonces el error es del orden de unos pocos cientos, y el número total de niños sería entre 19.500 y 20.500 con alta probabilidad (más del 95%).
Cada familia tendrá exactamente un niño, para un total de n varones (con 10,000 familias, tenemos 10,000 varones). La división de 10,000 por aproximadamente 20,000 produce algo cercano a 1/2. Esto puede hacerse riguroso, y lo hago debajo del pliegue.
- ¿Cómo la maternidad y el embarazo cambian el cuerpo de una mujer? ¿Cómo y por qué cambian las diferentes partes de los cuerpos de las mujeres embarazadas durante sus embarazos?
- ¿Me obligarán a tener una cesárea para mi segundo hijo (que vive en Australia) si tuviera uno para mi primer hijo?
- Maternidad: ¿Qué le debe uno a su madre por darles a luz?
- ¿Cuánto cuesta dar a luz un bebé sin complicaciones a un bebé sano?
- ¿Qué consejo tienes para presentarle a un niño pequeño a un nuevo bebé?
Sin embargo, la expectativa de la relación no es exactamente 1/2. Se espera que la proporción sea un poco más de 1/2. Para un cálculo exacto y más detalles sobre este efecto, consulte la maravillosa respuesta principal en http://mathoverflow.net/question…). Para ver la intuición básica, supongamos que la población tiene una sola familia. Con probabilidad 1/2, el porcentaje de niños en la población es del 100%. Con probabilidad 1/4, el porcentaje es del 50%. Con probabilidad 1/8 el porcentaje es del 33%. Y así. Sumando esto, se obtiene un 69% de niños en la familia, más del 50%. Esto muestra que para una población (muy) pequeña que consiste en una familia, el porcentaje esperado de niños es superior al 50%. Esto es cierto para todas las poblaciones con un número limitado de familias.
==
Detalles:
La controversia a la que se hace referencia en el enlace en los Detalles de la pregunta se produce porque el resultado en poblaciones pequeñas es diferente de la respuesta limitante a medida que el número de familias crece mucho. Todo se reduce a lo siguiente. Podemos definir una variable aleatoria X ( n ) para que sea el número total exacto de niños en la población con n familias completas (es decir, cada familia que ha producido su último hijo, un niño). La proporción de niños en esa población es la variable aleatoria [matemáticas] Y (n) = n / X (n) [/ matemáticas]. La expectativa de esta variable aleatoria (la proporción esperada de niños) definitivamente no es
[math] \ frac {n} {E [X (n)]} = \ frac {n} {2n} [/ math],
porque el operador de expectativa no conmuta con la división . El valor promedio de [math] 2n / X [/ math] no es el mismo que 2 n dividido por el valor promedio de X.
De hecho, debido a la convexidad de la función [math] f (x) = 1 / x [/ math], la desigualdad de Jensen promete que [math] E [Y (n)]> \ frac {n} {E [X ( n)]} = 1/2 [/ math], donde la desigualdad es estricta porque la distribución de Y ( n ) claramente no es degenerada. Así que el número esperado de niños no es exactamente 1/2; Es más. Si solo hay una familia, de modo que n = 1, entonces la fracción esperada de niños en la población (es decir, la familia) es de aproximadamente el 69% (http://mathoverflow.net/question…).
Sin embargo, al corregir cualquier [math] \ epsilon> 0 [/ math], cuando n es grande, el Teorema del límite central (http://en.wikipedia.org/wiki/Cen…) garantiza que la variable aleatoria X ( n ) está dentro de [math] n ^ {1/2 + \ epsilon} [/ math] de 2 n con probabilidad al menos [math] 1- \ epsilon [/ math]. Por lo tanto, la fracción esperada de niños será muy, muy cercana a 1/2 en grandes poblaciones. En particular, con probabilidad al menos [math] 1- \ epsilon [/ math], tendremos los límites
[math] \ frac {n} {2n + n ^ {1/2 + \ epsilon}} \ leq Y (n) \ leq \ frac {n} {2n-n ^ {1/2 + \ epsilon}}. [/mates]
Para n lo suficientemente grande, estas desigualdades implican que con probabilidad al menos [math] 1- \ epsilon [/ math].
[math] \ frac {1- \ epsilon} {2} \ leq Y (n) \ leq \ frac {1+ \ epsilon} {2} [/ math]
Por lo tanto, en realidad, la proporción realizada (aleatoria) de niños estará dentro de [math] \ epsilon [/ math] de 1/2 con probabilidad al menos [math] 1- \ epsilon [/ math]. Es un ejercicio fácil de derivar (usando el hecho de que Y ( n ) ha limitado el apoyo) que la expectativa también está dentro de [math] 2 \ epsilon [/ math] de 1/2 para n lo suficientemente grande.
La distribución exacta de Y ( n ) para muestras finitas se puede calcular fácilmente en una computadora, o analíticamente, y se puede ver que su expectativa converge rápidamente a 1/2 a medida que n crece. Sin embargo, Landsburg ganará su apuesta porque en su ejemplo (comenzar con cuatro familias y tener un hijo por año por familia durante treinta años), incluso la n final es bastante pequeña. Si empezáramos con 400 familias, Landsburg perdería su apuesta.
==
Para una gran discusión que contiene cálculos precisos de muestras finitas, que muestran que la proporción esperada de niños es mayor que 1/2 para cada n finita, consulte http://mathoverflow.net/question….
¿Cuál es la razón esencial detrás de la diferencia entre el cálculo de la muestra finita y el resultado asintótico? La observación clave es que la fracción esperada de niños en una familia es de aproximadamente el 69% . Y, de hecho, cuando reunimos a cualquier número de familias, el porcentaje esperado de niños estará por encima del 50%.
Para ver por qué la fracción esperada de niños en una familia es más del 50% , lo que es suficiente para ver la intuición clave, es útil considerar el siguiente experimento mental. Supongamos que llevamos un millón de familias. Haga una mesa alta, con una línea para cada familia. En la línea de cada familia, escriba el porcentaje de niños en la familia y el número de niños en la familia. Considera dos ejercicios.
(1) Sume los porcentajes y divídalos por un millón. Esto da el porcentaje promedio de niños en una familia.
(2) Multiplique cada porcentaje por el tamaño de la familia, sume los resultados y divídalo por la suma de los tamaños de la familia. Esto da el porcentaje de niños en la población.
Sabemos por lo anterior que la respuesta a (2) debería ser muy cercana al 50% porque la población es enorme. Tenga en cuenta que en el ejercicio (2), las familias con una mayoría de niños ganan menos peso en el promedio (porque son las más pequeñas). Si igualamos los pesos, que es exactamente lo que se hace en el ejercicio (1), entonces la respuesta llega a ser mayor al 50%.
==
[1] Al menos, su respuesta es incorrecta, suponiendo que el número total de hijos es una variable aleatoria no degenerada. Algunos argumentan que hay formas de interpretar la pregunta para que 1/2 sea la respuesta correcta. Vea los comentarios a continuación por Sridhar Ramesh y Jameson Quinn, así como la respuesta del usuario Quora. En mi opinión, las formalizaciones bajo las cuales 1/2 es la respuesta correcta (a la pregunta de cuál es la proporción esperada de niños en la población) no son naturales. De hecho, estoy bastante seguro de que (bajo interpretaciones razonables de todo) siempre que el tamaño total de la población sea aleatorio, 1/2 será incorrecto. El argumento de la desigualdad de Jensen en mi respuesta proporciona una razón para esto cuando el número de niños (el numerador) es determinista dado el tamaño de la población, pero creo que esto puede ser generalizado, aunque no sea trivial.
[2] Me refiero a la distribución geométrica que toma valores en el conjunto {1,2,3, …}. Esto supone que cada recién nacido es igualmente probable que sea un niño o una niña, y que el género es independiente en todos los nacimientos. Estoy ignorando a gemelos, trillizos, parejas sin hijos, etc. También estoy ignorando las dinámicas del ciclo de vida hablando como si todos los hijos de una familia aparecieran a la vez, tan pronto como existe la familia (esto equivale a ignorar a las familias que no lo son. Terminado con su maternidad). En poblaciones grandes, estos detalles se desvanecerán, por lo que no voy a atascar la respuesta con ellos. Pero es un buen ejercicio para comprobar eso.