Discussion:
Äquidistanz
(zu alt für eine Antwort)
Ulrich Freye
2005-09-26 20:59:34 UTC
Permalink
Hallo,
eine (sortierte) Zahlenfolge ist ja bekanntlich äquidistant, wenn die
Abstände von einem Wert zum anderen gleich sind.
Beispiele:
1,2,3,4,5 = ideal äquidistnt
1.1, 1.9, 3.1, 3.9, 5.1 = auch noch halbwegs äquidistant
1,2,3,4,6 = naja
1,1,2,3,4 = hm, eigentlich nicht
1,2,3,4,10 = nicht
1,2,3,4,100 = ganz sicher nicht

Ich suche nach einem berechenbaren Maß für Äquidistanz.

Eine Idee war, dass ich die Differenzen betrachte und aus ihnen den
Mitelwert X und die Standardabweichung S berechne und daraus den
relativen Variationskoeffizienten V=S/X.
Dann zeigt V = 0 die ideale Äquidistanz an, und Werte darüber eben eine
schlechtere.
Für die Beispiel ergäben sich Werte für V wie folgt:

0% 23% 40% 67% 111% 192%

Wäre das ein gangbarer Weg? Oder gibt es noch einen besseren?

Hintergrund: Für den funktionalen Zusammenhang von n Wertepaaren (X,Y)
soll eine bestgenäherte lineare Funktion Y=f(X) ermittelt werden und
zwar nach der gängigen Methode der linearen Regression.
Es ist ja bekannt, dass die Vertrauensintervalle einer solchen Näherung
sich ähnlich zweier Hyperbel-Äste um die Gerade Y=f(X) legen und dabei
am Mitelwert von X am kleinsten sind. D.h. dort sind die
Vertrauensintervalle am geringsten.
Das Problem ist nun, dass im Falle einer schwachen Äqudistanz von X der
Mittelwert von X weitab von den Messwerten X liegt. Also, das kleinste
Vertrauensintervall für einen Bereich gilt, der gar nicht in der
Wertereihe X abgebildet ist.
Also, bevor man die lineare Regression überhaupt anwenden kann bzw. ihr
Ergebnis als vertrauensüwrdig akzeptiert wird, muss erst eine
Äquidistanz nachgewiesen werden und am besten numerisch bewertet werden.
Es handelt sich um einen automatisierten Prozeß, sprich: die
Entscheidung "äquidistant ja/nein" soll von einer Software getroffen werden.

Alternativ bietet sich vielleicht die gewichtete Regression an. Dann
sollen im letztgenannten Beispiel die Wertepaare für X = 1...4 etwa
glichgeichtet werden, der weitab liegende Wert für X = 100 aber deutlich
geringer. Wie definiert man dann die Gewichte?

Habt ihr ne Idee? Danke.

Ulrich
Rainer Ziegenbein
2005-09-26 22:55:49 UTC
Permalink
Post by Ulrich Freye
Also, bevor man die lineare Regression überhaupt anwenden kann
bzw. ihr Ergebnis als vertrauensüwrdig akzeptiert wird, muss
erst eine Äquidistanz nachgewiesen werden
Warum sollte?
Ich weiss nicht, ob die "gewoehnliche" lineare Regression
aequidistante Stuetzstellen voraussetzt; im allgemeinen Falle
funktioniert Ausgleichsrechnung auch mit beliebig verteilten
Stuetzstellen.

Zum Verstaendnis nochmal eine Frage: Dein Problem besteht nur
darin, dass die Argumente X der Wertepaare (X,Y) nicht aequi-
distant sind - der Funktionswert Y gehoert aber trotzdem zu
genau diesem "krummen" Argument, richtig?
Post by Ulrich Freye
Alternativ bietet sich vielleicht die gewichtete Regression
an. Dann sollen im letztgenannten Beispiel die Wertepaare für
X = 1...4 etwa glichgeichtet werden, der weitab liegende Wert
für X = 100 aber deutlich geringer. Wie definiert man dann die
Gewichte?
Es gibt Ausreiszertests.
Grob gesagt laeuft das praktisch darauf hinaus, dass Werte, die
weiter als ein (problemspezifisch definierter) Schwellenwert
vom erwarteten Wert entferntliegen, verworfen werden. Man kann
aber sicher sanftere Methoden waehlen als eine zweiwertige
Gewichtsfunktion. Vielleicht hilft das Stichwort "Ausreiszertest".

Ich habe das mal bei der Signalverarbeitung als Filter verwendet.


Grusz,
Rainer
Peter Niessen
2005-09-26 22:37:11 UTC
Permalink
Post by Rainer Ziegenbein
Es gibt Ausreiszertests.
^^^^^^^^
Ausreisser so mal als Anmerkung ;-)

http://home.arcor.de/peter-niessen/NG.htm

Ob der Link auf meine HP da hilft sei dahingestellt da ich selber nicht
verstehe nach welchen Kriterien die Formelsammlung das so sieht.

Mit freundlichen Grüßen
Peter Nießen
Ulrich Freye
2005-09-27 18:25:31 UTC
Permalink
Rainer Ziegenbein schrieb:

Hi, danke für die Antwort
Post by Rainer Ziegenbein
Post by Ulrich Freye
Also, bevor man die lineare Regression überhaupt anwenden kann
bzw. ihr Ergebnis als vertrauensüwrdig akzeptiert wird, muss
erst eine Äquidistanz nachgewiesen werden
Warum sollte?
Ich weiss nicht, ob die "gewoehnliche" lineare Regression
aequidistante Stuetzstellen voraussetzt; im allgemeinen Falle
funktioniert Ausgleichsrechnung auch mit beliebig verteilten
Stuetzstellen.
Stimmt, funktioniert rechnerisch, liefert aber Vergurktes.
Stell dir eine völlig unkorrelierte Punktwolke vor und dazu einen
einzigen entfernter liegenden Punkt. Das korreliert numerisch sehr gut,
ist aber Banane. Ein kleines Beispiel unter

www.labaqs.de\xl\faulekorrelation.xls
Post by Rainer Ziegenbein
Zum Verstaendnis nochmal eine Frage: Dein Problem besteht nur
darin, dass die Argumente X der Wertepaare (X,Y) nicht aequi-
distant sind - der Funktionswert Y gehoert aber trotzdem zu
genau diesem "krummen" Argument, richtig?
Richtig.
Post by Rainer Ziegenbein
Post by Ulrich Freye
Alternativ bietet sich vielleicht die gewichtete Regression
an. Dann sollen im letztgenannten Beispiel die Wertepaare für
X = 1...4 etwa glichgeichtet werden, der weitab liegende Wert
für X = 100 aber deutlich geringer. Wie definiert man dann die
Gewichte?
Es gibt Ausreiszertests.
Grob gesagt laeuft das praktisch darauf hinaus, dass Werte, die
weiter als ein (problemspezifisch definierter) Schwellenwert
vom erwarteten Wert entferntliegen, verworfen werden. Man kann
aber sicher sanftere Methoden waehlen als eine zweiwertige
Gewichtsfunktion. Vielleicht hilft das Stichwort "Ausreiszertest".
Ja, damit habe ich auch schon mal experimentiert. Das war so'n
iterativer Ansatz. Man rechnet zunächst eine Regression mit gleichen
Gewichten. Berechnet dann für jedes Paar (X,Y) den Abstand zur Geraden
und wichtet die Paare entsprechend und rechnet erneut. Das führt dazu,
das von der Ausgleichsgeraden weit entfernte Paare weniger
berücksichtigt werden. Ausreißer werden dabei zwar nicht eliminiert,
haben aber geringeren Einfluss auf die Lage der Geraden. Das Stichwort
hierzu ist "robust". Man führt die Rechnungen iterativ weiter, bis sich
die Gerade nur noch unwesentlich ändert.
Post by Rainer Ziegenbein
Ich habe das mal bei der Signalverarbeitung als Filter verwendet.
Grusz,
Rainer
Juergen Luethje
2005-09-28 12:18:46 UTC
Permalink
Ulrich Freye schrieb:

<snip>
Post by Ulrich Freye
Stell dir eine völlig unkorrelierte Punktwolke vor und dazu einen
einzigen entfernter liegenden Punkt. Das korreliert numerisch sehr gut,
ist aber Banane. Ein kleines Beispiel unter
www.labaqs.de\xl\faulekorrelation.xls
Vielleicht hilft dir das weiter:
http://www.reiter1.com/Glossar/Glossar_detailliert_Inhalt.htm#Ausreisser

<snip>

Gruß,
Jürgen
Alex. Lupas
2005-10-05 14:34:34 UTC
Permalink
Post by Ulrich Freye
Hallo,
Ich suche nach einem berechenbaren Maß für Äquidistanz.
Eine Idee:
Es seien die Zahlen X={x_1,x_2,...,x_n} mit x_1 =< x_2=<...=< x_n.
Weiter

m_1:= SUM_{k=1 to k=n}x_k ,m_2:=SUM_{k=1 to k=n}x_k^2

D(X):= n*m_2 - m_1^2 ,

d(X):= min_{1=< i<k =<n}(x_k-x_i)

R(X):= C*sqrt(3D(X)/(n^2-1)) -d(X) mit C:= 2/n .

SATZ 1. R(X) >= 0 .
SATZ 2. R(X) = 0 <=====> wenn X={x_1,x_2,...,x_n} aequidistant
sind.

Es folgt :
DEFINITION: Wenn
X={x_1,x_2,...,x_n} mit x_1 =< x_2=<...=< x_n, und
Y={y_1,y_2,...,y_n} mit y_1 =< y_2=<...=< y_n,

dann X ist " mehr aequidistant als Y " <====> R(X) =< R(Y) .

Gruss, Alex
===========

Lesen Sie weiter auf narkive:
Loading...