Ulrich Freye
2005-09-26 20:59:34 UTC
Hallo,
eine (sortierte) Zahlenfolge ist ja bekanntlich äquidistant, wenn die
Abstände von einem Wert zum anderen gleich sind.
Beispiele:
1,2,3,4,5 = ideal äquidistnt
1.1, 1.9, 3.1, 3.9, 5.1 = auch noch halbwegs äquidistant
1,2,3,4,6 = naja
1,1,2,3,4 = hm, eigentlich nicht
1,2,3,4,10 = nicht
1,2,3,4,100 = ganz sicher nicht
Ich suche nach einem berechenbaren Maß für Äquidistanz.
Eine Idee war, dass ich die Differenzen betrachte und aus ihnen den
Mitelwert X und die Standardabweichung S berechne und daraus den
relativen Variationskoeffizienten V=S/X.
Dann zeigt V = 0 die ideale Äquidistanz an, und Werte darüber eben eine
schlechtere.
Für die Beispiel ergäben sich Werte für V wie folgt:
0% 23% 40% 67% 111% 192%
Wäre das ein gangbarer Weg? Oder gibt es noch einen besseren?
Hintergrund: Für den funktionalen Zusammenhang von n Wertepaaren (X,Y)
soll eine bestgenäherte lineare Funktion Y=f(X) ermittelt werden und
zwar nach der gängigen Methode der linearen Regression.
Es ist ja bekannt, dass die Vertrauensintervalle einer solchen Näherung
sich ähnlich zweier Hyperbel-Äste um die Gerade Y=f(X) legen und dabei
am Mitelwert von X am kleinsten sind. D.h. dort sind die
Vertrauensintervalle am geringsten.
Das Problem ist nun, dass im Falle einer schwachen Äqudistanz von X der
Mittelwert von X weitab von den Messwerten X liegt. Also, das kleinste
Vertrauensintervall für einen Bereich gilt, der gar nicht in der
Wertereihe X abgebildet ist.
Also, bevor man die lineare Regression überhaupt anwenden kann bzw. ihr
Ergebnis als vertrauensüwrdig akzeptiert wird, muss erst eine
Äquidistanz nachgewiesen werden und am besten numerisch bewertet werden.
Es handelt sich um einen automatisierten Prozeß, sprich: die
Entscheidung "äquidistant ja/nein" soll von einer Software getroffen werden.
Alternativ bietet sich vielleicht die gewichtete Regression an. Dann
sollen im letztgenannten Beispiel die Wertepaare für X = 1...4 etwa
glichgeichtet werden, der weitab liegende Wert für X = 100 aber deutlich
geringer. Wie definiert man dann die Gewichte?
Habt ihr ne Idee? Danke.
Ulrich
eine (sortierte) Zahlenfolge ist ja bekanntlich äquidistant, wenn die
Abstände von einem Wert zum anderen gleich sind.
Beispiele:
1,2,3,4,5 = ideal äquidistnt
1.1, 1.9, 3.1, 3.9, 5.1 = auch noch halbwegs äquidistant
1,2,3,4,6 = naja
1,1,2,3,4 = hm, eigentlich nicht
1,2,3,4,10 = nicht
1,2,3,4,100 = ganz sicher nicht
Ich suche nach einem berechenbaren Maß für Äquidistanz.
Eine Idee war, dass ich die Differenzen betrachte und aus ihnen den
Mitelwert X und die Standardabweichung S berechne und daraus den
relativen Variationskoeffizienten V=S/X.
Dann zeigt V = 0 die ideale Äquidistanz an, und Werte darüber eben eine
schlechtere.
Für die Beispiel ergäben sich Werte für V wie folgt:
0% 23% 40% 67% 111% 192%
Wäre das ein gangbarer Weg? Oder gibt es noch einen besseren?
Hintergrund: Für den funktionalen Zusammenhang von n Wertepaaren (X,Y)
soll eine bestgenäherte lineare Funktion Y=f(X) ermittelt werden und
zwar nach der gängigen Methode der linearen Regression.
Es ist ja bekannt, dass die Vertrauensintervalle einer solchen Näherung
sich ähnlich zweier Hyperbel-Äste um die Gerade Y=f(X) legen und dabei
am Mitelwert von X am kleinsten sind. D.h. dort sind die
Vertrauensintervalle am geringsten.
Das Problem ist nun, dass im Falle einer schwachen Äqudistanz von X der
Mittelwert von X weitab von den Messwerten X liegt. Also, das kleinste
Vertrauensintervall für einen Bereich gilt, der gar nicht in der
Wertereihe X abgebildet ist.
Also, bevor man die lineare Regression überhaupt anwenden kann bzw. ihr
Ergebnis als vertrauensüwrdig akzeptiert wird, muss erst eine
Äquidistanz nachgewiesen werden und am besten numerisch bewertet werden.
Es handelt sich um einen automatisierten Prozeß, sprich: die
Entscheidung "äquidistant ja/nein" soll von einer Software getroffen werden.
Alternativ bietet sich vielleicht die gewichtete Regression an. Dann
sollen im letztgenannten Beispiel die Wertepaare für X = 1...4 etwa
glichgeichtet werden, der weitab liegende Wert für X = 100 aber deutlich
geringer. Wie definiert man dann die Gewichte?
Habt ihr ne Idee? Danke.
Ulrich