Verfasst am: 07.09.2014, 10:08
Titel: Test auf Normalverteilung / sonstige Verteilung
Hallo,
ich habe einen Vektor mit ca. 8000 Werten zwischen -55 und +80.
Dazu möchte ich prüfen, ob für diese Werte von einer Normalverteilung oder von einer anderen Verteilung ausgenagnen werden kann.
Mein Vorgehen war bisher so:
1. Ich habe mit der Distribution Fitting Toolbox verschiedene Verteilungen angepasst. Bei der grafischen Darstellung fällt auf, dass die Werte des Vektors symmetrisch verteilt sind, jedoch im Vergleich zur Normalverteilung eine Konzentration der Werte um den Mittelwert aufweisen (d.h. die Glockenkurve ist spitzer und höher als bei der Normalverteilung).
Passt man eine t-location-scale (Student-t-Verteilung) an, so ergibt sich rein visuell eine sehr gute Abbildung.
Die Distribution Fitting Toolbox liefert folgende Outputs:
Für die Anpassung der Normalverteilung
Code:
Distribution: Normal
Log likelihood: -28892.6
Domain: -Inf < y < Inf Mean: 0.003129
Variance: 42.8931
Distribution: t Location-Scale
Log likelihood: -27583
Domain: -Inf < y < Inf Mean: -0.345743
Variance: 72.6054
Parameter Estimate Std. Err.
mu-0.3457430.0485707
sigma 3.636330.0574168
nu 2.445350.0831268
Estimated covariance of parameter estimates:
mu sigma nu
mu 0.002359110.0002314060.000339635
sigma 0.0002314060.003296690.00327788
nu 0.0003396350.003277880.00691007
Frage 1: Lässt sich allein aufgrund von diesen Werten schon sagen, dass es sich um eine Normalverteilte oder Student-t Verteilte Werte handelt?
Weiteres Vorgehen:
Ich habe dann versucht einen Chi2-Test sowie einen KSTest zu machen um die Hypothese auf Normalverteilung bzw. Student-t Verteilung zu legegen oder zu widerlegen. Dabei habe ich jedoch einige Probleme:
1. Ich bin nicht sicher wie der Output aus Matlab interpretiert werden muss.
2. Ich bin nicht sicher, ob ich die Werte richtig in die kstest bzw. chi2gof Funktion eingebe.
Kann mir dazu jemand vielleich ein Beispiel geben wo auch zu erkennen ist, wie die eingegebenen Vektoren aussehen?
jedoch im Vergleich zur Normalverteilung eine Konzentration der Werte um den Mittelwert aufweisen (d.h. die Glockenkurve ist spitzer und höher als bei der Normalverteilung)
Das kann auch lediglich heißen, dass die Standardabweichung klein ist.
Zitat:
Frage 1: Lässt sich allein aufgrund von diesen Werten schon sagen, dass es sich um eine Normalverteilte oder Student-t Verteilte Werte handelt?
Meines Erachtens kann man lediglich durch Vergleich der Log Likelihoods sagen, welche Verteilung besser ist.
Zitat:
1. Ich bin nicht sicher wie der Output aus Matlab interpretiert werden muss.
2. Ich bin nicht sicher, ob ich die Werte richtig in die kstest bzw. chi2gof Funktion eingebe.
Dann stelle doch bitte deinen Code zur Verfügung, und man kann dir sagen, ob das so sinnvoll ist.
Beispiele finden sich in der Dokumentation.
Grüße,
Harald
Tuomas
Gast
Beiträge: ---
Anmeldedatum: ---
Wohnort: ---
Version: ---
Verfasst am: 07.09.2014, 11:58
Titel:
Ich habe mal 2 Grafiken aus der Distibution Fitting Toolbox angehängt. Angepasst habe ich die Werte an eine Normalverteilung und eine T-Verteilung.
Danach habe ich versucht eine kstest zu machen. Dabei bin ich äquivalent zu dem Beispiel in der Matlab Doku vorgegangen. Der Vektor mit den Werten ist x. Die Variable tloc ist ein Export aus der Distribution Fitting Toolbox und enthält u.a. die Verteilungsparameter:
Wenn ich das Ergebnis richtig interpretiere bedeutet dass, dass man nicht davon ausgehen kann, dass x t-Verteilt ist. Dieses Ergebnis ist für mich aufgrund der Grafiken aus der Distribution Fitting Toolbox schwer nachvollziehbar. Daher stelle ich mir die Frage ob die Vorgehensweise korrekt ist.
Für die Normalverteilung sieht das ganze wie folgt aus:
Input:
Du kannst Beiträge in dieses Forum schreiben. Du kannst auf Beiträge in diesem Forum antworten. Du kannst deine Beiträge in diesem Forum nicht bearbeiten. Du kannst deine Beiträge in diesem Forum nicht löschen. Du kannst an Umfragen in diesem Forum nicht mitmachen. Du kannst Dateien in diesem Forum posten Du kannst Dateien in diesem Forum herunterladen
MATLAB, Simulink, Stateflow, Handle Graphics, Real-Time Workshop, SimBiology, SimHydraulics, SimEvents, and xPC TargetBox are registered trademarks and The MathWorks, the L-shaped membrane logo, and Embedded MATLAB are trademarks of The MathWorks, Inc.