Post by Helmut ZeiselPost by Johannes SinglerVielen Dank für die Links, genau das habe ich gesucht. Es gibt viele
Vermutungen und Begründungen, aber nur selten Zahlen ;-)
Es wäre in diesem Zusammenhang interessant, wenn Du hier die Ergebnisse
(reale Daten vs. angenommene Gleichverteilung) posten könntest.
Danke,
Helmut
Die Frage ging zwar an Johannes Singler, aber nachdem ich mich erst vor
kurzem mit diesem Problem beschaeftigt habe,
( http://www.research.att.com/projects/OEIS?Anum=A091673
http://www.research.att.com/projects/OEIS?Anum=A091674
http://www.research.att.com/projects/OEIS?Anum=A091715 + Links in diesen
OEIS-Folgen)
konnte ich der Versuchung nicht widerstehen, mit den in
http://www.dartmouth.edu/~chance/teaching_aids/data/birthday.txt
angegebenen Geburtstagsdaten fuer die 3333239 Geburten in den USA im
Jahr 1978 ein bisschen Monte Carlo - Simulation laufen zu lassen.
Dabei hab ich folgendes gemacht: Zuerst den Datenpool der 3.3Mio
Personen durch Random-Paarvertauschungen durchgemischt. Dann 10Mio
"Klassentreffen" der 1978er simuliert, wobei jeweils zufaellig solange
weitere Teilnehmer dazugenommen werden, bis der erste Doppeltreffer
auftritt (analog zu Rainer Rosenthals "Geburtstags-Paradoxon im
Online-Test", Sept. 2002). Das kann bereits beim zweiten Teilnehmer
passieren, bei 10Mio Versuchen treten aber auch durchaus Faelle mit mehr
als 100 benoetigten Teilnehmern bis zum ersten Doppeltreffer auf.
Fuer die beiden Faelle "Gleichverteilte Geburtstage" und "USA 1978
Geburten" hab ich jeweils 5 solcher 10Mio-Simulationen laufen gelassen.
Einen Vergleich der Ergebnisse (kumulierte %-Wahrscheinlichkeit ueber
der Gruppengroesse und Wahrscheinlichkeitsdichte) habe ich in
http://www.randomwalk.de/scimath/birth2.pdf
zusammengestellt, ebenso die Zahlenwerte aus den Simulationslauefen.
Fazit: Mit der realistischen Verteilung ist nach wie vor 23 die erste
Gruppengroesse, fuer die die kumulierte Wahrscheinlichkeit fuer einen
Doppeltreffer 50% uebersteigt. In meiner Simulation ueberschreitet die
interpolierte kumulierte Wahrscheinlichkeit 50% bei ca. 22.758 Personen
fuer die Gleichverteilung und bei ca. 22.677 Personen bei der
1978er-Verteilung (siehe Seite 4 in birth2.pdf). Der theoretische Wert
bei Gleichverteilung fuer 2 oder mehr Personen mit gleichem Geburtstag
liegt uebrigens bei ca. 22.769 Personen (interpoliert aus den Daten auf
der Mathworld-Seite http://mathworld.wolfram.com/BirthdayProblem.html ).
Wenn man einen Tip abgeben soll, beim wievielsten Gast in einer Runde
genau der erste Doppeltreffer auftritt, dann sollte man nicht "beim
23.", sondern besser "beim 20." tippen, da in dieser Gegend das Maximum
der Wahrscheinlichkeitsdichtefunktion auftritt (siehe Seite 10 in
birth2.pdf). Man verbessert damit seine Gewinnwahrscheinlichkeit von ca.
3.16% auf ca. 3.24% (auf der Basis USA 1978er Daten).
Hoffe mal, dass ich mich beim Programmieren nicht arg vertan hab. Dass
der Einfluss der realistischen Geburtstagsverteilung so klein ist,
duerfte die meisten doch ueberraschen. Es waer schoen, wenn jemand
dieses Ergebnis unabhaengig von mir nachpruefen koennte.
Hugo Pfoertner