Discussion:
Geburtstage gleichverteilt?
(zu alt für eine Antwort)
Johannes Singler
2005-01-17 16:45:47 UTC
Permalink
Hallo,

beim berühmten Geburtstagsparadoxon wird ja immer angenommen, die
Geburtstage seien gleichmäßig über das Jahr verteilt.

Ist das wirklich so? Leider habe ich im Netz keinerlei Statistik dazu
finden können. Ich könnte mir aber gut vorstellen, dass es da saisonale
Schwankungen gibt. Die Zeugung eines Kindes ist ja kein Zufallsprozess
;-)

Kann mir jemand damit weiterhelfen?

Gruß,
Johannes
Willy Butz
2005-01-17 16:51:24 UTC
Permalink
Post by Johannes Singler
Ist das wirklich so? Leider habe ich im Netz keinerlei Statistik dazu
finden können. Ich könnte mir aber gut vorstellen, dass es da saisonale
Schwankungen gibt. Die Zeugung eines Kindes ist ja kein Zufallsprozess
Neben den saisonalen Zeugungsschwankungen gibt es auch
noch geburtstechnische Schwankungen. So kommen deutlich
weniger Kinder am Wochenende zur Welt als an einem
Werktag. An exponierten Feiertagen (z.B. Weihnachten) sind
es noch weniger. Grund: aufgrund der reduzierten Bestzung
der Stationen in den Krankenhäusern werden Kinder, bei
denen man das entsprechend schieben kann vor oder nach
einem Feiertag geholt, aber nicht am Feiertag. Das gilt
z.B. für die meisten geplanten Kaiserschnittgeburten.
Quelle: ein befreundeter Arzt, der in einem Krankenhaus
fürs Reporting zuständig ist.

Viele Grüße,
Willy
Uwe Hercksen
2005-01-17 17:34:37 UTC
Permalink
Post by Johannes Singler
beim berühmten Geburtstagsparadoxon wird ja immer angenommen, die
Geburtstage seien gleichmäßig über das Jahr verteilt.
Hallo,

vor einigen Jahren hat doch mal in den USA ein längerer Stromausfall
nachts zu einer Überlastung der Geburtenabteilungen 9 Monate später geführt.

Bye
Jutta Gut
2005-01-17 18:04:57 UTC
Permalink
Post by Uwe Hercksen
vor einigen Jahren hat doch mal in den USA ein längerer Stromausfall
nachts zu einer Überlastung der Geburtenabteilungen 9 Monate später geführt.

Das dürfte eine urban legend sein.

Grüße
Jutta
Jutta Gut
2005-01-17 18:07:22 UTC
Permalink
"Johannes Singler" <***@jsingler.de> schrieb im Newsbeitrag news:***@news.rz.uni-karlsruhe.de...
Hallo,
Post by Johannes Singler
beim berühmten Geburtstagsparadoxon wird ja immer angenommen, die
Geburtstage seien gleichmäßig über das Jahr verteilt.
Post by Johannes Singler
Ist das wirklich so? Leider habe ich im Netz keinerlei Statistik dazu
finden können. Ich könnte mir aber gut vorstellen, dass es da saisonale
Schwankungen gibt. Die Zeugung eines Kindes ist ja kein Zufallsprozess
;-)


Ich nehme an, dass im Sommer etwas mehr Kinder gezeugt werden (die
"Urlaubsbabys"). Das ändert aber nichts am Geburtstagsparadoxon.
Denn wenn sich in bestimmten Jahreszeiten die Geburtstage häufen, wird
die Wahrscheinlichkeit, dass zwei Personen am selben Tag Geburtstag
haben, noch größer.

Grüße
Jutta
Rainer Rosenthal
2005-01-17 21:13:54 UTC
Permalink
"Jutta Gut" schrieb
Post by Jutta Gut
Denn wenn sich in bestimmten Jahreszeiten die
Geburtstage häufen, ...
... dann hat es die weise Natur so eingerichtet,
dass zu anderen Jahreszeiten die Geburten sich
weniger häufen.

Du kennst ja vielleicht die Geschichte von dem
Mann mit dem etwas zu kurzen Bein, der aber
ganz froh war, dass zum Ausgleich das andere etwas
länger war?

Scherz am Abend,
erquickend und labend.

Und nicht zu vergessen: Sowas wurde schon mal
längere Zeit munter bei uns diskutiert:
"Geburtstags-Paradoxon im Online-Test", Sept. 2002,
http://makeashorterlink.com/?B2B01224A

Gruss,
Rainer
Leonhard Vogt
2005-01-17 18:22:48 UTC
Permalink
Post by Johannes Singler
Hallo,
beim berühmten Geburtstagsparadoxon wird ja immer angenommen, die
Geburtstage seien gleichmäßig über das Jahr verteilt.
Was ist das Geburtstagsparadoxon?

Wenn es um die Wahrscheinlichkeit geht, mit der zwei
am gleichen Tag Geburtstag haben:
Das ist sogar noch wahrscheinlicher, wenn die Geburtstage nicht
gleichverteilt sind.

Leonhard
Stefan Müller
2005-01-18 11:25:46 UTC
Permalink
Post by Leonhard Vogt
Post by Johannes Singler
Hallo,
beim berühmten Geburtstagsparadoxon wird ja immer angenommen, die
Geburtstage seien gleichmäßig über das Jahr verteilt.
Was ist das Geburtstagsparadoxon?
Wenn es um die Wahrscheinlichkeit geht, mit der zwei
Das ist sogar noch wahrscheinlicher, wenn die Geburtstage nicht
gleichverteilt sind.
Leonhard
Klingt interessant. Intuitiv ist mir das auch klar.
Aber wie könnte man beweisen, dass die Wahrscheinlichkeit, dass 2 aus n
Personen am gleichen Tag Geburtstag haben am geringsten ist, wenn die
Geburtstage gleichverteilt übers Jahr sind?
Manfred Ullrich
2005-01-18 15:07:54 UTC
Permalink
Post by Stefan Müller
............... Das ist sogar noch wahrscheinlicher, wenn die Geburtstage nicht
gleichverteilt sind.
Klingt interessant. Intuitiv ist mir das auch klar.
Aber wie könnte man beweisen, dass die Wahrscheinlichkeit, dass 2 aus n
Personen am gleichen Tag Geburtstag haben am geringsten ist, wenn die
Geburtstage gleichverteilt übers Jahr sind?
Das muss man nicht beweisen, weil das logisch ist.
Stell Dir doch nur mal eine extrem ungleiche Verteilung vor.

Gruß, Manfred
Helmut Zeisel
2005-01-18 17:32:59 UTC
Permalink
Post by Manfred Ullrich
Das muss man nicht beweisen, weil das logisch ist.
Stell Dir doch nur mal eine extrem ungleiche Verteilung vor.
Aus f(0) = 1/366 und f(1)=1 folgt noch lange nicht, dass f(x)>1/366 fuer
alle x>0.

Helmut
Helmut Zeisel
2005-01-18 17:31:54 UTC
Permalink
Die Erweiterung auf Gruppen von mehr als 2 Personen wird
dem Leser als Uebungsaufgabe ueberlassen :-)
Ein eleganter Beweis fuer dieser Fall wuerde mich aber durchaus
interessieren.

Helmut
Roman Racine
2005-01-19 08:12:23 UTC
Permalink
Post by Helmut Zeisel
Ein eleganter Beweis fuer dieser Fall wuerde mich aber durchaus
interessieren.
Sei p := 1/N.

Für passende alpha(i) ist sum(p(i)^2,i=1..N) = sum((p + alpha(i))^2,i=1..N)

Weil sum(p(i),i=1..N) = sum((p + alpha(i)),i=1..N) = sum(p,i=1..N) +
sum(alpha(i),i=1..N) = sum(p,i=1..N) = 1
gilt sum(alpha(i),i=1..N) = 0.

sum((p + alpha(i))^2,i=1..N) = sum((p^2 + 2*p*alpha(i)+ alpha(i)^2),i=1..N)

Weil sum(2*p*alpha(i),i=1..N) = 2*p*sum(alpha(i),i=1..N) = 0

gilt
sum((p^2 + 2*p*alpha(i)+ alpha(i)^2),i=1..N) =
sum((p^2 + alpha(i)^2),i=1..N)

Bei Gleichverteilung sind alle alpha(i) = 0. Bei jeder anderen Verteilung
gibt es alpha(i) ungleich 0 und somit wird die Summe grösser sein.

Gruss

Roman
Helmut Zeisel
2005-01-19 09:02:06 UTC
Permalink
Post by Roman Racine
Post by Helmut Zeisel
Ein eleganter Beweis fuer dieser Fall wuerde mich aber durchaus
interessieren.
Sei p := 1/N.
Für passende alpha(i) ist sum(p(i)^2,i=1..N) = sum((p + alpha(i))^2,i=1..N)
Weil sum(p(i),i=1..N) = sum((p + alpha(i)),i=1..N) = sum(p,i=1..N) +
sum(alpha(i),i=1..N) = sum(p,i=1..N) = 1
gilt sum(alpha(i),i=1..N) = 0.
sum((p + alpha(i))^2,i=1..N) = sum((p^2 + 2*p*alpha(i)+ alpha(i)^2),i=1..N)
Weil sum(2*p*alpha(i),i=1..N) = 2*p*sum(alpha(i),i=1..N) = 0
gilt
sum((p^2 + 2*p*alpha(i)+ alpha(i)^2),i=1..N) =
sum((p^2 + alpha(i)^2),i=1..N)
Bei Gleichverteilung sind alle alpha(i) = 0. Bei jeder anderen Verteilung
gibt es alpha(i) ungleich 0 und somit wird die Summe grösser sein.
Das ist doch der Fall, ob 2 Personen auf einem Planten mit Jahreslängen
N Tagen am selben Tag Geburtstage haben. Dass sum_i p(1)^2 >= 1/N folgt
auch einfach daraus, dass das quadrat. Mittel >= dem arithmetischen
Mittel ist.

Mich wuerde aber der Beweis fuer den Fall von k>2 Persoenen auf einem
solchen Planeten interessieren, also in etwa

Sei sum_{1=1}^1 p_i =1; p_i >=0.

und

f_k(p_1,...,p_N) := sum_{i_1} p_{i_1} sum_{i_2 \not\in {i_1}} p_{i_2}
\dots sum_{i_k \not\in {i_1,\dots i_{k-1}} p_{i_k}}

die Wahrscheinlichkeit, dass alle k Personen an einem anderen Tag
Geburtstag haben.

Zu zeigen ist, dass f_k(p_1,...,p_N) maximal fuer p_1=...p_N=1/N

Helmut
Helmut
Gereon Schueller
2005-01-17 18:48:49 UTC
Permalink
http://math.hope.edu/swanson/statlabs/proj1_sample.html
zeigt eine ganz schöne Übersicht, darunter auch eine nach Monaten.
Mit den dort erwähnten Rohdaten von
http://www.dartmouth.edu/~chance/teaching_aids/data/birthday.txt
dürfte es sicher eine Freude sein, das Geb.-Problem für 1978 exakt zu
berechnen :)

Gruß

Gereon
Johannes Singler
2005-01-20 17:57:59 UTC
Permalink
In article <csh1af$mob$05$***@news.t-online.com>, ***@yahoo.de
says...
Post by Gereon Schueller
http://math.hope.edu/swanson/statlabs/proj1_sample.html
zeigt eine ganz schöne Übersicht, darunter auch eine nach Monaten.
Mit den dort erwähnten Rohdaten von
http://www.dartmouth.edu/~chance/teaching_aids/data/birthday.txt
dürfte es sicher eine Freude sein, das Geb.-Problem für 1978 exakt zu
berechnen :)
Vielen Dank für die Links, genau das habe ich gesucht. Es gibt viele
Vermutungen und Begründungen, aber nur selten Zahlen ;-)

Johannes
Helmut Zeisel
2005-01-21 11:32:56 UTC
Permalink
Post by Johannes Singler
Vielen Dank für die Links, genau das habe ich gesucht. Es gibt viele
Vermutungen und Begründungen, aber nur selten Zahlen ;-)
Es wäre in diesem Zusammenhang interessant, wenn Du hier die Ergebnisse
(reale Daten vs. angenommene Gleichverteilung) posten könntest.

Danke,

Helmut
Hugo Pfoertner
2005-01-22 12:18:07 UTC
Permalink
Post by Helmut Zeisel
Post by Johannes Singler
Vielen Dank für die Links, genau das habe ich gesucht. Es gibt viele
Vermutungen und Begründungen, aber nur selten Zahlen ;-)
Es wäre in diesem Zusammenhang interessant, wenn Du hier die Ergebnisse
(reale Daten vs. angenommene Gleichverteilung) posten könntest.
Danke,
Helmut
Die Frage ging zwar an Johannes Singler, aber nachdem ich mich erst vor
kurzem mit diesem Problem beschaeftigt habe,
( http://www.research.att.com/projects/OEIS?Anum=A091673
http://www.research.att.com/projects/OEIS?Anum=A091674
http://www.research.att.com/projects/OEIS?Anum=A091715 + Links in diesen
OEIS-Folgen)
konnte ich der Versuchung nicht widerstehen, mit den in
http://www.dartmouth.edu/~chance/teaching_aids/data/birthday.txt
angegebenen Geburtstagsdaten fuer die 3333239 Geburten in den USA im
Jahr 1978 ein bisschen Monte Carlo - Simulation laufen zu lassen.

Dabei hab ich folgendes gemacht: Zuerst den Datenpool der 3.3Mio
Personen durch Random-Paarvertauschungen durchgemischt. Dann 10Mio
"Klassentreffen" der 1978er simuliert, wobei jeweils zufaellig solange
weitere Teilnehmer dazugenommen werden, bis der erste Doppeltreffer
auftritt (analog zu Rainer Rosenthals "Geburtstags-Paradoxon im
Online-Test", Sept. 2002). Das kann bereits beim zweiten Teilnehmer
passieren, bei 10Mio Versuchen treten aber auch durchaus Faelle mit mehr
als 100 benoetigten Teilnehmern bis zum ersten Doppeltreffer auf.

Fuer die beiden Faelle "Gleichverteilte Geburtstage" und "USA 1978
Geburten" hab ich jeweils 5 solcher 10Mio-Simulationen laufen gelassen.
Einen Vergleich der Ergebnisse (kumulierte %-Wahrscheinlichkeit ueber
der Gruppengroesse und Wahrscheinlichkeitsdichte) habe ich in
http://www.randomwalk.de/scimath/birth2.pdf
zusammengestellt, ebenso die Zahlenwerte aus den Simulationslauefen.

Fazit: Mit der realistischen Verteilung ist nach wie vor 23 die erste
Gruppengroesse, fuer die die kumulierte Wahrscheinlichkeit fuer einen
Doppeltreffer 50% uebersteigt. In meiner Simulation ueberschreitet die
interpolierte kumulierte Wahrscheinlichkeit 50% bei ca. 22.758 Personen
fuer die Gleichverteilung und bei ca. 22.677 Personen bei der
1978er-Verteilung (siehe Seite 4 in birth2.pdf). Der theoretische Wert
bei Gleichverteilung fuer 2 oder mehr Personen mit gleichem Geburtstag
liegt uebrigens bei ca. 22.769 Personen (interpoliert aus den Daten auf
der Mathworld-Seite http://mathworld.wolfram.com/BirthdayProblem.html ).

Wenn man einen Tip abgeben soll, beim wievielsten Gast in einer Runde
genau der erste Doppeltreffer auftritt, dann sollte man nicht "beim
23.", sondern besser "beim 20." tippen, da in dieser Gegend das Maximum
der Wahrscheinlichkeitsdichtefunktion auftritt (siehe Seite 10 in
birth2.pdf). Man verbessert damit seine Gewinnwahrscheinlichkeit von ca.
3.16% auf ca. 3.24% (auf der Basis USA 1978er Daten).

Hoffe mal, dass ich mich beim Programmieren nicht arg vertan hab. Dass
der Einfluss der realistischen Geburtstagsverteilung so klein ist,
duerfte die meisten doch ueberraschen. Es waer schoen, wenn jemand
dieses Ergebnis unabhaengig von mir nachpruefen koennte.

Hugo Pfoertner
helmut zeisel
2005-01-22 23:12:30 UTC
Permalink
Post by Hugo Pfoertner
Dass
der Einfluss der realistischen Geburtstagsverteilung so klein ist,
duerfte die meisten doch ueberraschen.
Ja, mich überrascht es jedenfalls. Ich hätte vermutet, dass bei
realistischen Zahlen die 50% Schwelle ein bis drei Personen früher
erzielt wird als bei idealen.

Helmut

Loading...