Einzelabweichung, Varianz, Standardabweichung

WICHTIG: Der Betrieb von goMatlab.de wird privat finanziert fortgesetzt. - Mehr Infos...

Partner:

Forum

Option

[Erweitert]

• Diese Seite per Mail weiterempfehlen

Gehe zu:

Dagnabit

Forum-Century


	Beiträge: 244

	Anmeldedatum: 23.04.09

	Wohnort: ---

	Version: ---

Verfasst am: 27.04.2009, 09:43 Titel:

Hallo "Gast"

Was zu dabei zu beachten hast, ist dass der Mittelwert in Form des Erwartungswertes in der Standardabweichung beinhaltet ist.

Zu Deiner /n oder /(n-1) Frage:
der Nenner entspricht der Anzahl der Freiheitsgrade (also Anzahl der "Messungen" minus Anzahl der Unbekannten).

Wenn Du den Erwartungswert (in diesem Fall = Mittelwert) aus Deinen Daten !berechnest!, entspricht das einer Unbekannten -> /(n-1).

Wenn Du aber sagst, dass der Erwartungswert bekannt ist, dann musst Du /n nehmen.

Stichwort- empirische oder theoretische Stabw. .

Ich hoffe das war verständlich

lg
Martin

Helmert

Forum-Century


	Beiträge: 121

	Anmeldedatum: 04.09.08

	Wohnort: Karlsruhe

	Version: 2011a

Verfasst am: 27.04.2009, 09:46 Titel:

Anonymous hat Folgendes geschrieben:

Laut Wikipedia ist das quadratische Mittel
QMW=sqrt{ (x_1^2 +x_2^2 +...+x_N^2)/N }

Die mittlere quadratische Abweichung ist die Varianz (mit Stichprobenumfang n)
kleines_sigma^2=1/n *[ (x1-X)^2+(x2-X)^2+....]

Somit ist das Quadrat des quadratischen Mittels von den Abständen der Punkte zur Geraden(also hier: d) gleich die mittlere quadratische Abweichung (mit dem Teiler 1/n).
also: QMW^2 = kleines_sigma^2

Du hast recht, hier habe ich offenbar die Begriffe etwas durcheinandergeworfen.

Zitat:

Die Formel std für die Standardabweichung (S) wiederrum ist aber

Code:

stdabw = sqrt(sum((d-mean(d)).^2)/(length(d)-1));

Funktion ohne Link?

mit Teiler n-1,

Stimmt auch; das war ein Tippfehler meinerseits, den ich bei meinem letzten Beitrag erst im Nachhinein bemerkt und korrigiert hatte.

Zitat:

(laut kurzer googlesuche, ist die Standardabweichung mit 1/(n-1) die gebräuchlichste Form)

1/n und 1/(n-1) nähern sich mit größer werdendem n immer mehr an.

Sicher ist der Einfluss von 1/n und 1/(n-1) bei mir sehr klein, gibt es jedoch eine Begründung, warum ich dann gerade einmal 1/n und einmal 1/(n-1) nehme?

Wenn der theoretische Erwartungswert bekannt ist, nimmt man die Version mit 1/n. Das ist hier, der Fall, wenn es zutrifft, daß ein fehlerfreier Meßwert präzise auf der Geraden liegen müßte (Erwartungswert der Abweichung gleich null).

Ist der theoretische Erwartungswert unbekannt, nähert man ihn in der Formel durch den Mittelwert an, und zur Berechnung der Standardabweichung muß die 1/(n-1)-Formel verwendet werden. Da man in den meisten Anwendungen den theoretischen Erwartungswert nicht kennt, ist das, wie Wikipedia behauptet, die Standardformel.

Eine Begründung kann ich in diesem Rahmen nur andeuten. Die n Meßwerte stellen n (im Idealfall unabhängige) Informationen über einen (hier: physikalischen?) Zusammenhang dar. Ist der Erwartungswert unbekannt und muß man ihn durch den Mittelwert annähern, hat man bereits eine Information "verbraten", und es sind nur noch n-1 Informationen übrig, die zur Berechnung der Standardabweichung herangezogen werden können. Wenn du es noch genauer wissen willst, müßtest du vielleicht doch mal in ein Statistik-Buch schauen.

Zitat:

Ich denke mittlerweile, dass es für mich Sinn mache alle drei Größen (Mittelwert, Standardabweichung, mittlere quadr. Abweichung) zu berechenen und zu vergleichen.

Als "absolute" Aussage ist sicher die mittlere quadr. Abweichung sinnvoll, da die Abweichung von meiner Soll-Geraden "bestimmt" wird.

Aber gleichzeitig ist sicher der Mittelwert + Standardabweichung sinnvoll: Es könnte sein, dass die Messwerte nahe beeinander liegen (Standardabweichung klein) aber z.B. auf einer parallelen der Gerade, im Abstand = Mittelwert!
Diese Aussage bekomme ich allein durch die quadr. Abweichung nicht!

Helmert, kannst du meiner Überlegung soweit zustimmen?

Die Aussage klingt vernünftig, wobei ich den physikalischen Hintergrund deines Versuches nicht kenne, wovon wesentlich abhängt, welche Modellbildung (Erwartungswert = 0, Standardabweichung mit 1/n ODER Erwartungswert = Mittelwert und Standardabweichung mit 1/(n-1)) sinnvoll ist.

Gast


	Beiträge: ---

	Anmeldedatum: ---

	Wohnort: ---

	Version: ---

Verfasst am: 27.04.2009, 11:25 Titel:

Hallo Helmert,

von deiner äußerst zügigen Reaktionszeit auf meine Fragen bin ich einfach nur begeistert! Großes Lob!

Ok, das mit n und n-1 macht jetzt auch Sinn....

Da es dich vllt. interessiert:
Die Positionsdaten erhalte ich von einem Ortungssystem. Da ich die Versuche auf konstanter Höhe und mit entsprechendem Filter in der Auswertung durchgeführt habe, beschränke ich mich auf die x-y-Richtung.
Zu Beginn der Messreihen war es tatsächlich der Fall, dass die Werte sehr nahe beeinander gelegen sind, jedoch auf einer parallelen zu meiner tatsächlichen Bahn.

Evolution3

Gast


	Beiträge: ---

	Anmeldedatum: ---

	Wohnort: ---

	Version: ---

Verfasst am: 18.05.2009, 11:56 Titel:

Hallo
ich möchte die Leistung aus dem NEFZ Zyklus darstellen
Klappt auch soweit

Nur wie kann ich den Mittelwert zusätzlich über den Zyklzs in die Grafik plotten
Mit mean bekomm ich nur einen Wert

Danke

Gast


	Beiträge: ---

	Anmeldedatum: ---

	Wohnort: ---

	Version: ---

Verfasst am: 25.05.2009, 15:31 Titel:

Hallo Leute,

da ich eine weitere Frage zu meinem gestarteten Thread habe, schreibe ich hier weiter, ohne einen neuen zu starten.

Nun möchte ich gerne bestimmen, wieviele Werte jeweils zu welcher Genauigkeit geführt haben.

In d (hier nochmal kurz aufgeführt, von weiter oben) habe ich die Einzelabstände von meinen Messpunkten zur definerten Bahn (orthogonaler Abstand):

Code:

% Abstände
d = [f-pointsxx(1),g-pointsyy(1)]*n ;% d enthält die Einzelabweichungen

Funktion ohne Link?

Jetzt ist es so, dass die Werte in d sowohl positives Vorzeichen, als auch negatives haben können. Für die weitere Berechnung bräuchte ich aber den Betrag, richtig?

Code:

% Abstände Betrag
Betrag_d=norm(d);

Funktion ohne Link?

Geht so denn nicht eine Information verloren?

Leider sind meine Statistikkentnisse nicht so gut. Bei Wikipedia habe ich geschaut und Quartile bzw. Perzentile müssten für mich eigentlich das Richtige sein.

Wenn ich aus d das Quartil 25 berechnen würde, wüsste ich dass 25% der Werte darin liegen und mit dieser Genauigkeit vorliegen, und Quartil 75 dass 75% der Werte darin liegen und nur 25% darüber.
Ziehe ich beide voneinander ab, habe ich in dem Bereich 50% der Werte, die dann mit dieser Abweichung vorliegen.
Ich hoffe, dass es soweit noch stimmt.

Um nicht nur den Berich von 50% sondern auch 60....90 zu bestimmen, müsste dies doch mit den Perzentilen gehen, also

Perzentil 95er - Perzentil 5 = 90% der Werte liegen mit dieser Abweichung vor

P90 - P10 = 80
P85 - P 15= 70
P80 - P20 = 60
P85 - P35= 50 % der Werte liegen mit dieser Abweichung vor.

Ich hoffe, dass das schonmal die richtige Vorgehensweise ist.
Zur Umsetzung im Matlab habe ich ein File bei mathworks gefunden, was ich mal mit den relevanten Auszügen hier poste:

Code:

% define data set
x = [-.05, 2, .1 , .9, -.1, 0.3]';
Nx = size(x,1);

% define percent
kpercent = 75;

% STEP 1 - rank the data
y = sort(x);

% STEP 2 - find k% (k /100) of the sample size, n.
k = kpercent/100;
result = k*Nx;

% STEP 3 - if this is an integer, add 0.5. If it isn't an integer round up.
[N,D] = rat(k*Nx);
if isequal(D,1), % k*Nx is an integer, add 0.5
result = result+0.5;
else % round up
result = round(result);
end

% STEP 4 - Find the number in this position. If your depth ends
% in 0.5, then take the midpoint between the two numbers.
[T,R] = strtok(num2str(result),'0.5');
if strcmp(R,'.5'),
Qk = mean(y(result-0.5:result+0.5));
else
Qk = y(result);
end

% display result
fprintf(1,['\nThe ',num2str(kpercent),'th percentile is ',num2str(Qk),'.\n\n']);

Funktion ohne Link?

Wäre es dann korrekt mit Betrag_d die o.g. Perzentile zu berechnen und dann die Differenzen zu bilden?

Bin für eure Tipps dankbar!

Helmert

Forum-Century


	Beiträge: 121

	Anmeldedatum: 04.09.08

	Wohnort: Karlsruhe

	Version: 2011a

Verfasst am: 28.05.2009, 09:49 Titel:

Entschuldige, diesmal hat es etwas länger gedauert ...

Anonymous hat Folgendes geschrieben:

Jetzt ist es so, dass die Werte in d sowohl positives Vorzeichen, als auch negatives haben können. Für die weitere Berechnung bräuchte ich aber den Betrag, richtig?

Code:

% Abstände Betrag
Betrag_d=norm(d);

Funktion ohne Link?

Geht so denn nicht eine Information verloren?

Ja, so geht definitiv Information verloren, und die Berechnung von Quantilen (=Perzentilen) ist mit Absolutbeträgen nicht mehr ohne weiteres korrekt. Es ist nämlich im allgemeinen nicht gewährleistet, daß der Median (50-%-Perzentil) bei null liegt.

Die Vorgehensweise, die Streuung über verschiede Quantilsabstände zu charakterisieren erscheint mir sinnvoll. Viel einfacher geht es aber mit der Funktion quantile, z. B.

Code:

quantile(d,0.3)

Funktion ohne Link?

Übrigens, der Betrag der einzelnen Elemente eines Vektors wird mit abs(d) gebildet. norm(d) berechnet hingegen den Betrag des Vektors.

Gast


	Beiträge: ---

	Anmeldedatum: ---

	Wohnort: ---

	Version: ---

Verfasst am: 30.05.2009, 16:26 Titel:

Hallo Helmert,

mit abs(d) hast du natürlich völlig recht, habe ich nach dem posten auch gemerkt Wink

Ja, einfach die in Matlab implementierte Funktion zu nehmen ist eigentlich das Naheliegendste Wink

Ich nehme jetzt dennoch den Betrag. d als Einzelabweichung könnte z.B. sowohl werte -0.5oder auch +0.5 annehmen.
Bei der Interpretation des Ergebnisses (z.B. 0.3566 für ein bestimmtes Perzentil) verdopple ich diesen und dieser stellt dann meine "maximale mögliche" Abweichung dar. Der worst case ist damit sicher abgedeckt. Ist die Abweichung nur in eine Richtung, ist mein berechnetes Ergebnis zwar schlechter als "in Realität", aber so decke ich sicher den worst case ab.

	Gehe zu Seite Zurück 1, 2
Einstellungen und Berechtigungen
Beiträge der letzten Zeit anzeigen:	Du kannst Beiträge in dieses Forum schreiben. Du kannst auf Beiträge in diesem Forum antworten. Du kannst deine Beiträge in diesem Forum nicht bearbeiten. Du kannst deine Beiträge in diesem Forum nicht löschen. Du kannst an Umfragen in diesem Forum nicht mitmachen. Du kannst Dateien in diesem Forum posten Du kannst Dateien in diesem Forum herunterladen

Impressum | Nutzungsbedingungen | Datenschutz | FAQ |

RSS

Hosted by:

Copyright © 2007 - 2025 goMatlab.de | Dies ist keine offizielle Website der Firma The Mathworks

MATLAB, Simulink, Stateflow, Handle Graphics, Real-Time Workshop, SimBiology, SimHydraulics, SimEvents, and xPC TargetBox are registered trademarks and The MathWorks, the L-shaped membrane logo, and Embedded MATLAB are trademarks of The MathWorks, Inc.