ich würde gerne eine n*k Matrix in zwei Teile splitten, damit ich einen Teil als "Trainingsset" und den anderen Teil als "Validation Set" für eine Regression verwenden kann. Deshalb sollten Zeilen auch nicht in doppelt oder in beiden vorkommen.
Danke für die schnelle Antwort, aber ich hab es jetzt über einen Umweg schon selber hinbekommen.
Code:
data = xlsread('Kleiner Datensatz - 2.xlsx','Daten IL<2','A2:E6047');
sz = size(data); %Größe der Eingabematrix
L = sz(1,1); %Anzahl der Zeilen der Eingabematrix
k = sz(1,2); %Anzahl der Spalten der Eingabematrix
n = floor(0.8*L); %Anzahl der Zeilen, die dem Estimation Set zugeordnet werden
B = data(randperm(L),:); %bringt die Zeilen der Matrix in zufällige Reihenfolge
IV_est = B(1:n,1:k-1); %Unabhängige Variablen des Estimation Sets
DV_est = B(1:n,k); %Abhängige Varibale des Estimation Sets
IV_val = B(n+1:L,1:k-1); %Unabhängige Variablen des Validation Sets
DV_val = B(n+1:L,k); %Abbhängige Variable des Validation Sets
Du kannst Beiträge in dieses Forum schreiben. Du kannst auf Beiträge in diesem Forum antworten. Du kannst deine Beiträge in diesem Forum nicht bearbeiten. Du kannst deine Beiträge in diesem Forum nicht löschen. Du kannst an Umfragen in diesem Forum nicht mitmachen. Du kannst Dateien in diesem Forum posten Du kannst Dateien in diesem Forum herunterladen
MATLAB, Simulink, Stateflow, Handle Graphics, Real-Time Workshop, SimBiology, SimHydraulics, SimEvents, and xPC TargetBox are registered trademarks and The MathWorks, the L-shaped membrane logo, and Embedded MATLAB are trademarks of The MathWorks, Inc.