WICHTIG: Der Betrieb von goMatlab.de wird privat finanziert fortgesetzt. - Mehr Infos...

Mein MATLAB Forum - goMatlab.de

Mein MATLAB Forum

 
Gast > Registrieren       Autologin?   

Partner:




Forum
      Option
[Erweitert]
  • Diese Seite per Mail weiterempfehlen
     


Gehe zu:  
Neues Thema eröffnen Neue Antwort erstellen

Auslesen einer XML-Datei beschleunigen

 

komm.geh.fort
Forum-Newbie

Forum-Newbie


Beiträge: 2
Anmeldedatum: 24.10.18
Wohnort: ---
Version: ---
     Beitrag Verfasst am: 24.10.2018, 10:17     Titel: Auslesen einer XML-Datei beschleunigen
  Antworten mit Zitat      
Hallo,

meine Messdaten liegen leider ausschließlich im XML-Format vor. Ich habe auch schon einen entsprechendes Skript in Matlab, um die gewünschten Daten auszulesen.
Mein Problem ist es, dass das importieren sehr zeitaufwändig ist. Momentan sind es noch 10.000 Werte pro XML, aber es werden demnächst deutlich mehr sein (mind. 100.000).

Hat jemanden einen Tipp wie ich das einlesen beschleunigen könnte?

Code:
clear all
close all
clc

x=xmlread('dist.xml');
w=xmlread('omega.xml');

entries = x.getDocumentElement.getLength;
x_a=zeros(1,entries-1);w_a=zeros(1,entries-1);
x_child=x.getDocumentElement.getChildNodes;
w_child=w.getDocumentElement.getChildNodes;

tic
for i=1:entries-1
x_a(i) = str2double(x_child.item(i).getTextContent);
w_a(i) = str2double(w_child.item(i).getTextContent);
end
toc

figure
plot(-x_a,w_a)


dist.txt
 Beschreibung:
Endung ändern zu .xml

Download
 Dateiname:  dist.txt
 Dateigröße:  464.72 KB
 Heruntergeladen:  211 mal
omega.txt
 Beschreibung:
Endung ändern zu .xml

Download
 Dateiname:  omega.txt
 Dateigröße:  534.98 KB
 Heruntergeladen:  231 mal
Private Nachricht senden Benutzer-Profile anzeigen


Jan S
Moderator

Moderator


Beiträge: 11.057
Anmeldedatum: 08.07.10
Wohnort: Heidelberg
Version: 2009a, 2016b
     Beitrag Verfasst am: 25.10.2018, 09:53     Titel: Re: Auslesen einer XML-Datei beschleunigen
  Antworten mit Zitat      
Hallo komm.geh.fort,

XML ist nicht einfach zu parsen, da hilft auch keine Zauberei.
Wenn die Files aber garantiert genauso aussehen, könnte dies helfen - auf eigenes Risiko:
Code:
C = fileread('dist.xml');
m = zeros(size(C));
m(C == '<') = 1;
m(C == '>') = -1;
m = cumsum(m);
C(m) = ' ';
value = sscanf(C, '%g', inf);

Das ist natürlich ausgesprochen brutal, denn es werden alle Information außer den Werten schlicht ignoriert. Aber falls die XML-Files wirklich alle so sehr sortiert sind, sollte es trotzdem laufen.

Gruß, Jan
Private Nachricht senden Benutzer-Profile anzeigen
 
komm.geh.fort
Themenstarter

Forum-Newbie

Forum-Newbie


Beiträge: 2
Anmeldedatum: 24.10.18
Wohnort: ---
Version: ---
     Beitrag Verfasst am: 25.10.2018, 11:12     Titel:
  Antworten mit Zitat      
Hi Jan,

Viele Dank! Ja die Daten werden immer so vorliegen.
Der Code hat nicht auf Anhieb funktioniert und ich musste noch ein paar kleine Änderungen vornehmen:
- m musste ich in ein array aus logischen Werten konvertieren (für C(m))
- und die übrigen ">"-Zeichen musste ich noch rauslöschen, sadass sscanf funktioniert.

Weiß nicht ob es so in deinem Sinne war, aber es läuft auf jeden Fall 1000x schneller Wink


Code:
C = fileread('dist.xml');
m = zeros(size(C));
m(C == '<') = 1;
m(C == '>') = -1;
m = logical(cumsum(m));
C(m) = ' ';
C_rep=strrep(C,'>','');              % restliche "<"-Zeichen löschen
value = sscanf(C_rep, '%g', inf);
Private Nachricht senden Benutzer-Profile anzeigen
 
Jan S
Moderator

Moderator


Beiträge: 11.057
Anmeldedatum: 08.07.10
Wohnort: Heidelberg
Version: 2009a, 2016b
     Beitrag Verfasst am: 25.10.2018, 11:45     Titel:
  Antworten mit Zitat      
Hallo komm.geh.fort,

Stimmt: m auf -1 zu setzen, wenn C=='>' ist noch nicht korrekt. Eigentlich müsste das erste Zeichen nach dem ">" eine -1 bekommen. Dann muss man aber noch berücksichtigen, dass auch das letzte Zeichen im File ein ">" ist. Deine Methode funktioniert ja schon, das hier ist eine Alternative:
Code:
C = fileread('dist.xml');
m = zeros(size(C));
m(C == '<') = 1;
q = strfind(C, '>') + 1;
m(q(q < numel(C))) = -1;
m = logical(cumsum(m));
C(m) = ' ';
value = sscanf(C_rep, '%g', inf);

Gruß, Jan
Private Nachricht senden Benutzer-Profile anzeigen
 
Neues Thema eröffnen Neue Antwort erstellen



Einstellungen und Berechtigungen
Beiträge der letzten Zeit anzeigen:

Du kannst Beiträge in dieses Forum schreiben.
Du kannst auf Beiträge in diesem Forum antworten.
Du kannst deine Beiträge in diesem Forum nicht bearbeiten.
Du kannst deine Beiträge in diesem Forum nicht löschen.
Du kannst an Umfragen in diesem Forum nicht mitmachen.
Du kannst Dateien in diesem Forum posten
Du kannst Dateien in diesem Forum herunterladen
.





 Impressum  | Nutzungsbedingungen  | Datenschutz | FAQ | goMatlab RSS Button RSS

Hosted by:


Copyright © 2007 - 2024 goMatlab.de | Dies ist keine offizielle Website der Firma The Mathworks

MATLAB, Simulink, Stateflow, Handle Graphics, Real-Time Workshop, SimBiology, SimHydraulics, SimEvents, and xPC TargetBox are registered trademarks and The MathWorks, the L-shaped membrane logo, and Embedded MATLAB are trademarks of The MathWorks, Inc.