|
|
Bootstrapping: Was genau passiert dabei in MatLab? |
|
rowJoe |

Forum-Fortgeschrittener
|
 |
Beiträge: 57
|
 |
|
 |
Anmeldedatum: 25.11.12
|
 |
|
 |
Wohnort: ---
|
 |
|
 |
Version: 2015b
|
 |
|
|
 |
|
Verfasst am: 14.12.2012, 13:18
Titel: Bootstrapping: Was genau passiert dabei in MatLab?
|
 |
|
 |
|
Hallo Leute,
ich beschäftige mich gerade in Zusammenhang mit einer sehr umfangreichen Datenanalyse mit dem Thema Bootstrapping. Zur Veranschaulichung meiner Frage habe ich euch das angehänfte Bild plotten lassen.
Was habe ich gemacht?
Ich habe an 30 Bauteilen jeweils einen Messwert abgenommen. Diese Werte seht ihr in der oberen Grafik. Da dieser Stichprobenumfang für die Beschreibung einer Verteilungsfunktion nicht ausreicht, habe ich aus diesen 30 Messwerten mittels Bootstrapping 500 sozusagen imaginäre Messwerte ziehen lassen. Die Bootstraps habe ich dabei 100 mal durchführen lassen.
Was habe ich vor?
Für meine weitere Arbeit muss ich wissen ob meine Daten normalverteilt sind. Im Idealfall möchte ich auch eine Aussage darüber treffen können wie die Daten verteilt sind und welche Verteilungsfunktion vorliegt. Da für statistische Tests 30 Messwerte nicht ausreichen, jedoch mehr Messwerte aus unterschiedlichen Gründen nicht zu bekommen sind habe ich mit dem Resampling (Bootstrapping) die Datenbasis imaginär erweitern wollen. Dies seht ihr nun in der Grafik.
Was ist die Frage?
Nachdem ich die Grafik erstellt habe, ist deutlich zu sehen, dass sich die Verteilungen deutlich unterscheiden. Nach meinem Verständnis zieht das Bootstrapping zwischen dem kleinsten und größten realen Messwert eine bestimmte Anzahl (in diesem Fall z.B. 500) von imaginären Messwerten. Allerdings hat sich die Verteilung dieser Werte nun deutlich geändert. Wie kann das erklärt werden? Also: Was macht Matlab mit meinen Daten? Da wir nun deutlich mehr (500) Werte generiert haben, hat Matlab ja zwischen den relaen Messwerten interpoliert. Aber was genau passiert da?
Ich hoffe ihr könnt mir weiterhelfen... Für die weitere Datenauswertung bzw. das weitere Programmieren muss ich sicher gehen können, dass Matlab die Verteilungsfunktion nicht verfälscht bzw. wie ich das sicherstellen kann...
Hier der Abschnitt in meinem Code, in dem ich das Bootstrapping anwende (falls der gesammte Code benötigt wird, sagt bitte bescheid).
Vielleicht noch zur Erläuterung: Ich habe mehrere Schnitte (LfdSchnitt), es geht aber erstmal nur um einen Schnitt (Annahme LfdSchnitt = 1). BootstrpCycle definiert die Anzahl der Durchläufe (hier: 100) und BootstrpIteration die Anzahl der mittels Bootstrapping generierten imaginären Messwerte.
Beschreibung: |
Beispiel der Verteilungen mit/ohne Bootstrapping |
|
 Download |
Dateiname: |
Beispiel Schnitt22.jpg |
Dateigröße: |
31.27 KB |
Heruntergeladen: |
653 mal |
|
|
|
|
|
rowJoe |
Themenstarter

Forum-Fortgeschrittener
|
 |
Beiträge: 57
|
 |
|
 |
Anmeldedatum: 25.11.12
|
 |
|
 |
Wohnort: ---
|
 |
|
 |
Version: 2015b
|
 |
|
|
 |
|
Verfasst am: 16.12.2012, 12:42
Titel:
|
 |
Kann mir wirklich niemand helfen? Keiner eine Idee?
Ich denke es liegt am Ausdruck @mean in der Funktion "bootstrp". Was muss ich hier wählen, damit die Verteilungen nicht beeinflusst werden?
|
|
|
Harald |

Forum-Meister
|
 |
Beiträge: 24.499
|
 |
|
 |
Anmeldedatum: 26.03.09
|
 |
|
 |
Wohnort: Nähe München
|
 |
|
 |
Version: ab 2017b
|
 |
|
|
 |
|
Verfasst am: 16.12.2012, 15:40
Titel:
|
 |
Hallo,
es ist schwierig, mit der langwierigen Erklärung etwas anzufangen.
Um die Histogramme vergleichen zu können, würde ich auf jeden Fall sicherstellen, dass beide Male das gleiche Binning und die gleiche Skala verwendet werden.
Bzgl. der Frage, was Bootstrapping macht: mehr als die Doku zu übersetzen könnte ich da auch nicht bieten.
Grüße,
Harald
|
|
|
blubb |
Gast
|
 |
Beiträge: ---
|
 |
|
 |
Anmeldedatum: ---
|
 |
|
 |
Wohnort: ---
|
 |
|
 |
Version: ---
|
 |
|
|
 |
|
Verfasst am: 17.12.2012, 00:49
Titel:
|
 |
es bedarf keiner weiteren ausführungen bezüglich deines matlab-codes weil dein vorhaben schon nicht legitim scheint.
bootstrappen bedeutet nichts weiter als dass aus deiner stichprobe elelemente mit gleicher wahrscheinlichkeit gezogen werden.
nur weil du damit deine samplegröße künstlich vergrößern kannst, kannst du daraus nichts aber auch wirklich nichts über die verteilung deiner realen kleinen stichprobe schließen.
|
|
|
blubb |
Gast
|
 |
Beiträge: ---
|
 |
|
 |
Anmeldedatum: ---
|
 |
|
 |
Wohnort: ---
|
 |
|
 |
Version: ---
|
 |
|
|
 |
|
Verfasst am: 17.12.2012, 00:55
Titel:
|
 |
was du aber machen könntest:
du könntest ~3000 bootstrappsamples in größe deines stichprobenumfanges ziehen und für jedes sample die schiefe bzw kurtosis berechnen. dann hast du eine empirische verteilung über die schiefe und kurtosis und kannst checken ob diese statistiken signifikant von 0 und 3 verschieden sind.
|
|
|
rowJoe |
Themenstarter

Forum-Fortgeschrittener
|
 |
Beiträge: 57
|
 |
|
 |
Anmeldedatum: 25.11.12
|
 |
|
 |
Wohnort: ---
|
 |
|
 |
Version: 2015b
|
 |
|
|
 |
|
Verfasst am: 17.12.2012, 18:40
Titel:
|
 |
|
 |
|
Hallo Harald,
Hallo blubb,
zunächst danke für eure Antworten und eure Mühe. Im Handbuch hatte ich bereits gesucht und auch in einigen anderen Foren (jedoch nichts dazu gefunden), daher auch dieser Beitrag.
blubb hat Folgendes geschrieben: |
nur weil du damit deine samplegröße künstlich vergrößern kannst, kannst du daraus nichts aber auch wirklich nichts über die verteilung deiner realen kleinen stichprobe schließen. |
Ich habe das Bootstrapping durchgeführt, damit ich die Hypotesentests durchführen kann. Das wird mit N = 30 Teilen ein wenig schwierig bzw. funktionieren die Tests dann nicht entsprechend gut. Wie blubb schon meinte, kann ich mir nach dem Resampling der Daten die Schiefe und Wölbung ausgeben lassen. Dies habe ich auch bereits getan. Allerdings seht ihr ja, dass die Verteilungsfunktion durch das Bootstrapping beeinflusst wird. Dadurch wird auch die Schiefe und Wölbung beeinflusst (meine Vermutung).
Dies kommt denke ich, durch das @mean in der Funktion. Muss ich hier irgendetwas anderes (wenn ja, was) wählen, damit die Daten weniger stark/gar nicht beeinflusst werden?
Viele Grüße
jonas
|
|
|
|
|
Einstellungen und Berechtigungen
|
|
Du kannst Beiträge in dieses Forum schreiben. Du kannst auf Beiträge in diesem Forum antworten. Du kannst deine Beiträge in diesem Forum nicht bearbeiten. Du kannst deine Beiträge in diesem Forum nicht löschen. Du kannst an Umfragen in diesem Forum nicht mitmachen. Du kannst Dateien in diesem Forum posten Du kannst Dateien in diesem Forum herunterladen
|
|
Impressum
| Nutzungsbedingungen
| Datenschutz
| FAQ
| RSS
Hosted by:
Copyright © 2007 - 2025
goMatlab.de | Dies ist keine offizielle Website der Firma The Mathworks
MATLAB, Simulink, Stateflow, Handle Graphics, Real-Time Workshop, SimBiology, SimHydraulics, SimEvents, and xPC TargetBox are registered trademarks and The MathWorks, the L-shaped membrane logo, and Embedded MATLAB are trademarks of The MathWorks, Inc.
|
|