efiizienterer Code -> Vektorisierung??

WICHTIG: Der Betrieb von goMatlab.de wird privat finanziert fortgesetzt. - Mehr Infos...

Partner:

Forum

Option

[Erweitert]

• Diese Seite per Mail weiterempfehlen

Gehe zu:

Jan S

Moderator


	Beiträge: 11.058

	Anmeldedatum: 08.07.10

	Wohnort: Heidelberg

	Version: 2009a, 2016b

Verfasst am: 03.10.2012, 00:28 Titel:

Hallo Christina,

Zusätzliche eckige Klammern reduzieren die Lesbarkeit und Laufzeit (wenn auch nur sehr wenig). Noch ein paar ander Vorschläge:

Code:

function y_predict = kregression(x_train,y_train, x_predict, h)
SizeOfX = size(x_train,1);
n = size(x_predict, 1);

y_predict = zeros(n,1);
W = zeros(SizeOfX, 1);
K = 0;
c = 2 * h ^ 2;

for i = 1:n
for j = 1:SizeOfX
W(j) = exp(-sum((x_predict(i,:) - x_train(j, :)) .^ 2) / c);
end

K = K + sum(W);
if K ~= 0
y_predict(i) = sum(W .* y_train) / K;
end
end

Funktion ohne Link?

Ich habe die Kommentare hier weggelassen, in den richtigen Code gehören sie aber unbedingt rein.

Unter welchen Bedingungen kann K überhaupt 0 werden?

Dies wäre schneller, wenn Du "x_predict" und "x_train" transponierst. Dann könnte in:

Code:

W(j) = exp(-sum((x_predict(:, i) - x_train(:, j)) .^ 2) / c);

Funktion ohne Link?

auch benachbarte Speicherzellen im RAM zugegriffen werden, was deutlich effizienter ist.

Gruß, Jan

Christina

Gast


	Beiträge: ---

	Anmeldedatum: ---

	Wohnort: ---

	Version: ---

Verfasst am: 03.10.2012, 09:49 Titel:

Hallo Harald, Hallo Jan,
vielen Dank für eure Tips! Harald, ich werde mal versuchen ob ich das hin bekomme, glaube zwar nicht daran, aber ich versuche es =)

Jan, auch dir vielen Dank, das hilft mir schon einmal sehr. Zu der Frage wann K null werden kann. Also ich brauche die abfrage auf jeden fall, denn K wird am anfang sehr oft null, denn genau dann wenn die betrachteten Punkte zu weit von dem eigentlich punkt weg sind. wenn K sehr groß wird, und das wird es häufig, dann muss ich y_predict(i)=0 setzten denn sonst wird y_predict=[NaN,....NaN] und das zerstört dann den kompletten Algorithmus..
Also dass K=0 ist kein Sonderfall. x_train ist entweder 2000x1 oder 2000x5 groß und x_perdict 12000x1 oder 12000x5, somit wird K schon sehr groß, denn es berechnet exp(quadratischem Abstand zwischen den beiden Punkten).

Eine allgemeine Frage noch an dich Jan, warum kann man [] weg lassen? bzw wann braucht man es denn dann? ich dachte man benutzt das um der neu definierten variable "zu sagen, dass sie ein vektor/matrix ist". brauche ich dies also nur, wenn ich tatsächlich was in den vektor/,atrix rein schreiben will?

Christina

Gast


	Beiträge: ---

	Anmeldedatum: ---

	Wohnort: ---

	Version: ---

Verfasst am: 03.10.2012, 10:04 Titel:

noch eine Frage an dich Harald,

Zitat:

Du könntest die W(j) am Anfang berechnen und sie dann in der Schleife verwenden.

Wie meinst du das am anfang? also vor der aller ersten for schleife? aber ich brauche doch die indizes der for schleife.. oder meintest du das so, wie es Jan nach dir beschrieben hat?

Zitat:

Die Berechnung der W(j) ist für verschiedene h sehr ähnlich. Es wäre also wohl möglich, dass kregression einen Vektor von h's entgegennimmt und das ganze sp effizienter abgearbeitet wird.

Schließlich kann man wohl noch bsxfun verwenden, um x_predict(i, Smile

-x_train(j, Smile

für festes i effizienter zu berechnen.

Das bedeutet, wenn ich [h] übergebe, müsste ich dann an die funktion smoothingParameter eine Matrix übergeben, in der in jeder spalte y_predict für verschiedene h steht, und dann in smoothingParameter y_h auf jede Spalte anwenden um dann mit der min funktion das kleinste element mit der zugehörigen position zu bekommen?

ich müsste dann also auch für W eine matrix bekommen, nur wie verbinde ich das dann alles mit bsxfun? habe mir schon die doku dazu durchgelesen, nur ist mir noch nicht ganz klar an welcher stelle ich das machen soll...

Tut mir leid, dass ich mich da so blöd anstelle und vielen dank für eure geduld...

Christina

Gast


	Beiträge: ---

	Anmeldedatum: ---

	Wohnort: ---

	Version: ---

Verfasst am: 03.10.2012, 13:17 Titel:

Zitat:

Code:

K = K + sum(W);

Funktion ohne Link?

Hier brauche ich doch dann nur noch K = sum(W) weil ich es nicht mehr schritt für schritt hochzähle und somit keinen initialwert von K benötige, oder?

Jan S

Moderator


	Beiträge: 11.058

	Anmeldedatum: 08.07.10

	Wohnort: Heidelberg

	Version: 2009a, 2016b

Verfasst am: 03.10.2012, 15:57 Titel:

Hallo Christina,

Harald's Tip W(j) am Anfang zu berechnen, habe ich in mein Code-Beispiel eingebaut.

Ich glaube, dass BSXFUN hier nicht viel bringen wird, da das Erzeugen großer temprärer Matrizen wieder mehr Zeit benötigt. Insgesamt ist das teure EXP aber wohl viel dominanter und die anzahl der Elemente, auf die EXP angewendet wird lässt sich nicht reduzieren.

Man kann [] weglassen, wenn der Inhalt ein Skalar ist, oder sowieso bereit ein Vektor:

Code:

X = 25; % [X] = 25 bringt hier nichts
Y = 1:5; % [1:5] macht aus dem Vektor 1:5 einen Vektor, also überflüssig
Z = [1, 2, 4:6]; % Zusammenfassung zu Vektor notwendig

Funktion ohne Link?

Vielleicht wird es klarer, wenn man bedenkt, dass für "[x,y]" intern die Funktion horzcat() aufgerufen wird, und für "[x;y]" vertcat(). Für einen Skalar gibt es aber nichts zusammen zu fassen.

Gruß, Jan

Christina

Gast


	Beiträge: ---

	Anmeldedatum: ---

	Wohnort: ---

	Version: ---

Verfasst am: 03.10.2012, 18:34 Titel:

oh man ich verzweifel hier gerade sowas von, sitze den ganzen Tag schon dran und verstehe einafch nicht wo der fehler ist...

also an sich macht dein code beispiel, jan, das ganze doppelt so schnell, würde dann also für den einfachen fall anstatt 29 stunden nur noch 14.5 brauchen, ist immernoch nicht top, aber schon um einiges besser. ABER: es kommt einfach nicht das richtige erbegnis raus, der wert den das liefert, ist zwisch 3,8 und 4,1 und bei meiner langsamen implementation zwischen 1,8 und 2,1. ich verstehe aber einfach nicht wo die differenz her kommen soll?!

Kann es vielleicht sein, dass

Code:

for j=1:SizeOfX
K=K+ exp(-sum((x_predict(i,:)-x_train(j,:)).^2)/(2*h^2));
end

Funktion ohne Link?

nicht das richitge berechnet?

K=K+... bedeutet doch, dass in jeder iteration der vorherige K wert genommen wird und darauf dann der neue term (exp...) drauf addiert wird oder?

Jan S

Moderator


	Beiträge: 11.058

	Anmeldedatum: 08.07.10

	Wohnort: Heidelberg

	Version: 2009a, 2016b

Verfasst am: 03.10.2012, 22:31 Titel:

Hallo Christina,

Ich habe keine Ahnung, ob wir wissen können, ob Dein Code das Richtige berechnet. Wir wissen ja noch nicht mal, was Du überhaupt berechnen möchtest. Zudem stehen hier im Thread viele einzelne Code-Fragmente und wir kennen nicht die unterschiedlichen Codes, die Du miteinander vergleichst.

Es ist merkwürdig, das K nicht in jeder Iteration auf 0 gesetzt wird, sondern auf die vorherigen Werte aufsummiert wird. Aber das könnte auch richtig sein.

Wenn Du Code mit Input-Daten postest, so dass wir ihn selbst laufen lassen können, wäre eine Laufzeit-Optimierung deutlich einfacher.

Gruß, Jan

Christina

Gast


	Beiträge: ---

	Anmeldedatum: ---

	Wohnort: ---

	Version: ---

Verfasst am: 04.10.2012, 11:34 Titel:

ok, also ich lade jetzt auf zwei mal alle datein hoch, die in der monte carlo simulation verwendet werden, inclusive der zwei Aufrufe mit kontreketen daten.

bei meiner Regressionsfunktion soll der nadaraya watson kernschätzer berechnet und implementiert werden, ich habe die zugeörigen gleichungen als bild beigefügt!

payoff2.m

Beschreibung: