Discussion:
Lottozahlen Ente
(zu alt für eine Antwort)
wernertrp
2017-10-15 13:19:16 UTC
Permalink
wurde behauptet in den letzten 60 Jahren wurde die Zahl 13 am seltensten gezogen.

http://www.bz-berlin.de/artikel-archiv/die-zahl-13-wurde-beim-lotto-bisher-am-seltensten-gezogen.

Wie hoch ist die Standardabweichung ?
Oliver Jennrich
2017-10-15 15:32:37 UTC
Permalink
Post by wernertrp
wurde behauptet in den letzten 60 Jahren wurde die Zahl 13 am
seltensten gezogen.
http://www.bz-berlin.de/artikel-archiv/die-zahl-13-wurde-beim-lotto-bisher-am-seltensten-gezogen.
Wie hoch ist die Standardabweichung ?
Laut
http://www.dielottozahlende.net/lotto/6aus49/statistiken/haeufigkeit%20der%20lottozahlen.html

ist die '13' 622-mal gezogen worden. Geht man von unabhängigen Ereignissen
aus, unterliegt die Wahrscheinlichkeit, dass innerhalb eines gewissen
Zeitraums n Ereignisse stattfinden der Poissonstatistik. Und deren
Standardabweichung ist bekanntlich (?) Wurzel(n).

Wenn man die gemessene Häufigkeit als Schätzwert für die tatsächliche
Häufigkeit nimmt, dann ist die Standardabweichung also etwa 25.
--
Space - The final frontier
pirx42
2017-10-15 16:40:12 UTC
Permalink
Post by Oliver Jennrich
Post by wernertrp
wurde behauptet in den letzten 60 Jahren wurde die Zahl 13 am
seltensten gezogen.
http://www.bz-berlin.de/artikel-archiv/die-zahl-13-wurde-beim-lotto-bisher-am-seltensten-gezogen.
Wie hoch ist die Standardabweichung ?
Laut
http://www.dielottozahlende.net/lotto/6aus49/statistiken/haeufigkeit%20der%20lottozahlen.html
ist die '13' 622-mal gezogen worden. Geht man von unabhängigen Ereignissen
aus, unterliegt die Wahrscheinlichkeit, dass innerhalb eines gewissen
Zeitraums n Ereignisse stattfinden der Poissonstatistik. Und deren
Standardabweichung ist bekanntlich (?) Wurzel(n).
Wenn man die gemessene Häufigkeit als Schätzwert für die tatsächliche
Häufigkeit nimmt, dann ist die Standardabweichung also etwa 25.
Poissonstatistik, wo hast Du den Schmarrn gelesen?
Bitte, wen man keine Ahnung hat, ist es besser, still zu sein.
Detlef Müller
2017-10-15 17:21:09 UTC
Permalink
Post by Oliver Jennrich
Post by wernertrp
wurde behauptet in den letzten 60 Jahren wurde die Zahl 13 am
seltensten gezogen.
http://www.bz-berlin.de/artikel-archiv/die-zahl-13-wurde-beim-lotto-bisher-am-seltensten-gezogen.
Wie hoch ist die Standardabweichung ?
Laut
http://www.dielottozahlende.net/lotto/6aus49/statistiken/haeufigkeit%20der%20lottozahlen.html
Man beachte hier auch die anschließenden "Küchen-Statistik"-
Argumentationen ...

Einmal mit dem "gesunden Menschenverstand", der folgert, daß ja nun
die 13 aufholen muß und daher mit erhöhter Wahrscheinlichkeit kommen
wird,

und dann zur Sicherheit noch mit dem "Gesetz der Serie", nach dem die
13 nun erfahrungsgemäß seltener gezogen wird und daher stets die
geringere Wahrscheinlichkeit hat.

So sind dann alle Möglichkeiten abgedeckt -
[ nach dem Motto:
"Rechnen sie das bitte dreimal nach, da die Sache wichtig ist"
...
"Ok, habe es dreimal nachgerechnet und ihnen alle 4 Ergebnisse
notiert!"
]

Der "gesunde Menschenverstand" sucht halt überall nach Mustern und
ein Prinzip wie "Gedächtnislosigkeit" scheint daher intuitiv völlig
unbegreiflich.

Gruß,
Detlef
--
Dr. Detlef Müller,
http://www.mathe-doktor.de oder http://mathe-doktor.de
Stefan Ram
2017-10-15 20:03:30 UTC
Permalink
Post by Detlef Müller
Einmal mit dem "gesunden Menschenverstand", der folgert, daß ja nun
die 13 aufholen muß und daher mit erhöhter Wahrscheinlichkeit kommen
wird,
Diese Sichtweise wird auch »parainduktionistisch« genannt
(»Parainduktionismus«):

Die Sonne ging bisher morgens immer auf, also ist es sehr
unwahrscheinlich, daß sie dies morgen auch wieder tun wird.
Es kann ja nicht /schon wieder/ sein. Das wäre ein Riesenzufall!
Post by Detlef Müller
und dann zur Sicherheit noch mit dem "Gesetz der Serie", nach dem die
13 nun erfahrungsgemäß seltener gezogen wird und daher stets die
geringere Wahrscheinlichkeit hat.
»Orthoinduktionismus«:

Die Sonne ging bisher morgens immer auf, also ist es sehr
wahrscheinlich, daß sie dies morgen auch wieder tun wird.
Was sollte sie sonst auch anderes tun?

Rational betrachtet ist beides nicht begründbar. Wir können
im allgemeinen nicht viel darüber sagen, ob die Sonne morgen
aufgehen wird. /Wenn/ wir jedoch ein bestimmtes Weltmodell
zugrundelegen, dann ist es sehr wahrscheinlich, daß sie
morgen wieder aufgehen wird

"Experimentelle Ermittlung" der Standardabweichung von
einer zufälligen Auswahl aus 49 Kugeln:

main.cpp

#include <cmath>
#include <cstdlib>
#include <initializer_list>
#include <iostream>
#include <ostream>

int main()
{ auto m { 0.0 };
auto q { 0.0 };
auto const n { 100'000'000 };
for( auto i = decltype( n ){ 0 }; i < n; ++i )
{ auto const k { i + 1 };
auto const x = int( 1 + 49 *( rand() /( RAND_MAX + 1. )) );
if( i )
{ auto const d { x - m };
q = q +( i * d * d )/ k;
m = m +( x - m )/ k;}
else { q = 0; m = x; }}
auto const sn_squared { q /( n - 1 ) }; /* sample variance */
auto const sigma_squared { q / n }; /* standard variance */
auto const stabw { ::std::sqrt( sn_squared ) };
::std::cout << stabw << '\n'; }

transcript

14.1431

Beim Lotto wird aber immer in Sechsergruppen gezogen, so
daß eine Zahl, die schon einmal in einer Sechsergruppe
vorkam, nicht erneut in derselben Sechsergruppe vorkommen
darf. Ich weiß nicht, ob das die Standardabweichung verändert.

Also simulieren wir das auch noch!

main.cpp

#include <algorithm> // ::std::random_shuffle, ::std::copy_n
#include <array>
#include <cmath>
#include <cstdlib>
#include <initializer_list>
#include <iostream>
#include <iterator> // ::std::ostream_iterator
#include <numeric> // ::std::iota
#include <ostream>
#include <random>

using num = int;

static ::std::array< num, 6 >drawing;
::std::mt19937 algorithm{ ::std::random_device{}() };

static int fill()
{ using size_type = ::std::vector< num >::size_type;
auto output = ::std::ostream_iterator< int >( ::std::cout, " " );
constexpr size_type total_size = 49;
constexpr size_type selection_size = 6;
::std::array< num, total_size >a;
{ constexpr num offset = 1; ::std::iota( begin( a ), end( a ), offset ); }
shuffle( begin( a ), end( a ), algorithm );
::std::copy_n( ::std::cbegin( a ), selection_size, ::std::begin( drawing ));}

static int next()
{ static auto next { 6 };
if( next >= 6 ){ fill(); next = 0; }
return drawing[ next++ ]; }

int main()
{ auto m { 0.0 };
auto q { 0.0 };
auto const n { 100'000'000 };
for( auto i = decltype( n ){ 0 }; i < n; ++i )
{ auto const k { i + 1 };
auto const x = next();
if( i )
{ auto const d { x - m };
q = q +( i * d * d )/ k;
m = m +( x - m )/ k;}
else { q = 0; m = x; }}
auto const sn_squared { q /( n - 1 ) }; /* sample variance */
auto const sigma_squared { q / n }; /* standard variance */
auto const stabw { ::std::sqrt( sn_squared ) };
::std::cout << stabw << '\n'; }

transcript

14.1428
Stefan Ram
2017-10-15 21:09:55 UTC
Permalink
Post by Stefan Ram
14.1431
14.1428
Nach einer Literaturquelle beträgt die Standardabweichung
der gezogenen Lottozahlen (nach 25 Jahren bei 1302
Ausspielungen) tatsächlich 14,1651.

Die Häufigkeiten betragen (Stand: wohl nuller Jahre):

f( 187, 1 )
f( 194, 2 )
f( 194, 3 )
f( 178, 4 )
f( 176, 5 )
f( 187, 6 )
f( 175, 7 )
f( 179, 8 )
f( 201, 9 )
f( 173, 10 )
f( 175, 11 )
f( 180, 12 )
f( 157, 13 )
f( 181, 14 )
f( 172, 15 )
f( 180, 16 )
f( 190, 17 )
f( 183, 18 )
f( 191, 19 )
f( 181, 20 )
f( 200, 21 )
f( 191, 22 )
f( 186, 23 )
f( 177, 24 )
f( 196, 25 )
f( 200, 26 )
f( 180, 27 )
f( 167, 28 )
f( 186, 29 )
f( 182, 30 )
f( 199, 31 )
f( 211, 32 )
f( 189, 33 )
f( 175, 34 )
f( 183, 35 )
f( 199, 36 )
f( 175, 37 )
f( 199, 38 )
f( 199, 39 )
f( 195, 40 )
f( 183, 41 )
f( 182, 42 )
f( 189, 43 )
f( 181, 44 )
f( 188, 45 )
f( 191, 46 )
f( 175, 47 )
f( 195, 48 )
f( 207, 49 )

. Wenn ich das Elektronengehirn damit füttere:

main.cpp

#include <algorithm> // ::std::random_shuffle, ::std::copy_n
#include <array>
#include <cmath>
#include <cstdlib>
#include <initializer_list>
#include <iostream>
#include <iterator> // ::std::ostream_iterator
#include <numeric> // ::std::iota
#include <ostream>
#include <random>

int source[] {1,1,1...49,49,49}; /* Zeile für Posting gekürzt! */
/* Zeile enthaelt "1," 187 Mal, und so weiter */

int main()
{ auto m { 0.0 };
auto q { 0.0 };
auto const n { sizeof source / sizeof 0[ source ] };
for( auto i = decltype( n ){ 0 }; i < n; ++i )
{ auto const k { i + 1 };
auto const x = source[ i ];
if( i )
{ auto const d { x - m };
q = q +( i * d * d )/ k;
m = m +( x - m )/ k;}
else { q = 0; m = x; }}
auto const sn_squared { q /( n - 1 ) }; /* sample variance, "Varianz" */
auto const sigma_squared { q / n }; /* standard variance */
auto const stabw { ::std::sqrt( sn_squared ) };
::std::cout << stabw << '\n'; }

transcript

14.1659

erhalte ich ein etwas (in zirka der dritten Nachkommastelle)
abweichendes Ergebnis.
Oliver Jennrich
2017-10-15 21:16:08 UTC
Permalink
Post by Stefan Ram
Post by Stefan Ram
14.1431
14.1428
Nach einer Literaturquelle beträgt die Standardabweichung
der gezogenen Lottozahlen (nach 25 Jahren bei 1302
Ausspielungen) tatsächlich 14,1651.
Eine Quellenangaben wäre nicht schlecht.
Post by Stefan Ram
f( 187, 1 )
...
Post by Stefan Ram
f( 207, 49 )
Also so rund 200 pro Zahl. Und damit ist die erwartete
Standardabewichung Wurzel(200), wie bei einer Poissonverteilung zu
erwarten.
--
Space - The final frontier
pirx42
2017-10-16 11:28:08 UTC
Permalink
Post by Oliver Jennrich
Post by Stefan Ram
Post by Stefan Ram
14.1431
14.1428
Nach einer Literaturquelle beträgt die Standardabweichung
der gezogenen Lottozahlen (nach 25 Jahren bei 1302
Ausspielungen) tatsächlich 14,1651.
Eine Quellenangaben wäre nicht schlecht.
Post by Stefan Ram
f( 187, 1 )
...
Post by Stefan Ram
f( 207, 49 )
Also so rund 200 pro Zahl. Und damit ist die erwartete
Standardabewichung Wurzel(200), wie bei einer Poissonverteilung zu
erwarten.
Mein Gott, das ist KEINE Poissonverteilung. Es gibt Lehrbücher über Statistik. Muß man nur lesen.
Stefan Ram
2017-10-15 21:52:17 UTC
Permalink
Post by Stefan Ram
Post by Stefan Ram
14.1431
14.1428
14.1659
Die Verteilung einer einzelnen Kugelziehung ist eine
diskrete gleichförmige ("uniforme") Verteilung ("diskrete
Gleichverteilung") (jede Zahl zwischen 1 und 49 ist
gleichwahrscheinlich).

Für diese Verteilung und mit diesen Parametern (m=49)
ist der Erwartungswert:

my =( m + 1 )/2 =( 49 + 1 )/ 2 = 50/2 = 25

und die Standardabweichung:
_________ __________ ___
sigma_x = /(m²-1)/12 = /(49²-1)/12 = /200 ~ 14.142135623730950488016887242097

. Man sieht, daß meine Simulation noch näher am
theoretischen Wert liegt als die experimentelle
Standardabweichung. Immerhin habe ich ja auch 100 Millionen
Kugeln ausgezählt!
Gottfried Helms
2017-10-17 12:31:07 UTC
Permalink
Post by Stefan Ram
Post by Detlef Müller
Einmal mit dem "gesunden Menschenverstand", der folgert, daß ja nun
die 13 aufholen muß und daher mit erhöhter Wahrscheinlichkeit kommen
wird,
Diese Sichtweise wird auch »parainduktionistisch« genannt
Die Sonne ging bisher morgens immer auf, also ist es sehr
unwahrscheinlich, daß sie dies morgen auch wieder tun wird.
Es kann ja nicht /schon wieder/ sein. Das wäre ein Riesenzufall!
Wunderbar!
Das paßt zu dem Lachen der Sonne heute... :-)

<G>
Ralf Goertz
2017-10-21 12:17:29 UTC
Permalink
Am Sun, 15 Oct 2017 06:19:16 -0700 (PDT)
Post by wernertrp
wurde behauptet in den letzten 60 Jahren wurde die Zahl 13 am
seltensten gezogen.
http://www.bz-berlin.de/artikel-archiv/die-zahl-13-wurde-beim-lotto-bisher-am-seltensten-gezogen.
Wie hoch ist die Standardabweichung ?
Für mich wäre eher die Frage die, ob die Seltenheit statistisch
signifikant ist, aber selbst wenn ist das eine post-hoc-Statistik, die
nichts aussagt, weil eine Zahl die seltenste sein muss. Aber mal zum
Spielen:

Ich würde nicht von einer Poisson- sondern einer Binomialverteilung
ausgehen. Ich nehme die Statistik von
http://www.dielottozahlende.net/lotto/6aus49/statistiken/haeufigkeit%20der%20lottozahlen.html
ohne Zusatzzahl. Dabei handelt es sich um 5637 Ziehungen (=Summe der
Häufigkeiten/6). In jeder dieser Ziehungen ist die Wahrscheinlichkeit
für die 13 bei Gleichverteilung aller Zahlen 6/49.
Post by wernertrp
binom.test(624,5637,6/49)
Exact binomial test

data: 624 and 5637
number of successes = 624, number of trials = 5637, p-value = 0.00688
alternative hypothesis: true probability of success is not equal to 0.122449
95 percent confidence interval:
0.1026209 0.1191788
sample estimates:
probability of success
0.1106972

Also signifikant, sogar bei zweiseitiger Testung. Allerdings gilt das
Post by wernertrp
binom.test(751,5637,6/49)
Exact binomial test

data: 751 and 5637
number of successes = 751, number of trials = 5637, p-value = 0.01475
alternative hypothesis: true probability of success is not equal to 0.122449
95 percent confidence interval:
0.1244587 0.1423766
sample estimates:
probability of success 0.1332269

Wie gesagt, das ist eigentlich die falsche Fragestellung. Die müsste
lauten: Gibt es signifikante Unterschiede in den Häufigkeiten, mit denen
die Zahlen gezogen wurden. Im Moment fällt mir dafür kein geeigneter
Test ein, daher eine Simulation. Wir lassen "runs" Mal 5637 Ziehungen
durchlaufen und schauen uns jedesmal die Häufigkeit der am seltensten
gezogenen Zahl an.


simulate_freq=function(runs,draws=5637) {
mins=array(0,runs)
for (i in 1:runs) {
n=array(0,49)
for (j in 1:draws) {
drawn=array(0,49)
for (k in 1:6) {
repeat {
z=floor(runif(1,1,50))
if(drawn[z]==0) break
}
drawn[z]=1
}
n=n+drawn
}
mins[i]=min(n)
}
return(mins[order(mins)])
}
Post by wernertrp
m=simulate_freq(1000)
sum(m<=624)/1000
[1] 0.142

Ergebnis: mit etwa 15% Wahrscheinlichkeit ist eine so kleine oder noch
kleinere Häufigkeit wie die der 13 zu erwarten. Ziemlich selten, aber
nicht signifikant.

Lesen Sie weiter auf narkive:
Loading...