WICHTIG: Der Betrieb von goMatlab.de wird privat finanziert fortgesetzt. - Mehr Infos...

Mein MATLAB Forum - goMatlab.de

Mein MATLAB Forum

 
Gast > Registrieren       Autologin?   

Partner:




Forum
      Option
[Erweitert]
  • Diese Seite per Mail weiterempfehlen
     


Gehe zu:  
Neues Thema eröffnen Neue Antwort erstellen

mit regexp Daten aus Textzeile separieren

 

DSP
Forum-Meister

Forum-Meister



Beiträge: 2.117
Anmeldedatum: 28.02.11
Wohnort: ---
Version: R2014b
     Beitrag Verfasst am: 21.11.2013, 21:00     Titel: mit regexp Daten aus Textzeile separieren
  Antworten mit Zitat      
Hallo goMatlab User,

ich habe eine Frage, die wohl schon einige hier nicht mehr lesen können. Aber leider bin ich im Forum noch nicht auf einen Lösungsansatz gestoßen. Mit der MatLab Hilfe komme ich hier leider auch nicht wirklich weiter. Sorry also, für eine weitere Frage zum Thema "Text einlesen".

Ich habe z.B. folgende Textzeilen:

Code:
% Textzeile 1:
textline{1,1} =  'message="test , test", vehicle="Team 123", driver="Fahrer xyz"'
% Textzeile 2:
textline{2,1} =  'position="1", laps="5", laptime="-1.000", rfpos="1", vehicle=" Team 123", positionInClass="1"'


Ich möchte nun die Textzeilen wie folgt separieren.

Alle Daten stehen in " " und lassen sich ja einfach mit
Code:
regexp(textline{1,1},'"')

herausfiltern. Was ich aber nicht schaffe, ist sozusagen der "Datentyp" zu separieren bzw. dies soll der Feldname eines structs werden. Mit dem Komma als Delimiter komme ich leider nicht weiter, da ein Komma auch innerhalb der " " sein kann (siehe erste Textzeile).

Letztendlich soll alles in einem Struct gespeichert werden. Der Feldname steht dabei in der Textzeile immer vor dem = Zeichen

Code:

% Hier als Bsp. für die erste Zeile
% data.fieldname = value;
data.message = {'test , test'};
data.team = {'Team 123'};
data.vehicle = {'Fahrer XYZ'};
data.position = {''};
data.laps = {''};
data.laptime = {''};
data.rfpos = {''};
data.positionInClass = {''};

% Hier als Bsp. für die zweite Zeile
% data.fieldname = value;
data.message = {''};
data.team = {'Team 123'};
data.vehicle = {'Fahrer XYZ'};
data.position = {'1'};
data.laps = {'5'};
data.laptime = {'-1.000'};
data.rfpos = {'1'};
data.positionInClass = {'1'};
 


Mit geht es nicht um die Erstellung der Struktur, sondern nur um das Separieren der Feldnamen aus der Textzeile. Ich nehme mal an das regexp hier ein Lösungsansatz ist, aber ich verstehe die Hilfe nicht, wie ich die expr aufstellen muss.

Vielen Dank für eure Hilfe.
Private Nachricht senden Benutzer-Profile anzeigen


denny
Supporter

Supporter



Beiträge: 3.853
Anmeldedatum: 14.02.08
Wohnort: Ulm
Version: R2012b
     Beitrag Verfasst am: 21.11.2013, 21:55     Titel:
  Antworten mit Zitat      
Hallo

versuche mal so, habe zur später Stunde leider keine bessere Idee:

Code:

textline= regexprep(textline,'",','"\n')
regexp(textline,'\n','split')
 



edit: habe jetzt noch einwenig rumprobiert:

Code:

regexp(textline{1},'(?<feld>\w+)="(?<wert>[a-zA-Z0-9,_\s]+)"','names')
%
% oder so übersichtlicher

regexp(textline{1},'(?<feld>\w+)="(?<wert>.+?)"','names')
 
Private Nachricht senden Benutzer-Profile anzeigen
 
DSP
Themenstarter

Forum-Meister

Forum-Meister



Beiträge: 2.117
Anmeldedatum: 28.02.11
Wohnort: ---
Version: R2014b
     Beitrag Verfasst am: 22.11.2013, 11:11     Titel:
  Antworten mit Zitat      
Vielen Dank für die schnelle und kompetente Hilfe Denny!

Funktioniert ohne Fehler.
Private Nachricht senden Benutzer-Profile anzeigen
 
DSP
Themenstarter

Forum-Meister

Forum-Meister



Beiträge: 2.117
Anmeldedatum: 28.02.11
Wohnort: ---
Version: R2014b
     Beitrag Verfasst am: 27.11.2013, 15:05     Titel:
  Antworten mit Zitat      
Ich habe noch eine andere Frage zum Thema regexp. Leider verstehe ich die Hilfe zum Aufstellen der expression immer noch nicht.

Diesmal get es um <Tags>. Ich möchte den Tagname und den Inhalt zwischen den Tags als Wert haben.

Code:

% z.B.

tline = {'<Name>Fahrer XYZ</Name>';
'<Connected>1</Connected>';
'<VehFile>126_TEAM_XYZ.VEH</VehFile>'
'<UpgradeCode>26000000 00000000</UpgradeCode>';
'<VehName>126 Team XYZ</VehName>'}
% Funktioniert leider nicht wie gewollt
[tag_name value] = regexp(tline{1,1},'<(\w+).*?>.*?</\1>','tokens','names')
 


Es wird zwar der Tag richtig gelesen, aber nicht der Wert.
Private Nachricht senden Benutzer-Profile anzeigen
 
denny
Supporter

Supporter



Beiträge: 3.853
Anmeldedatum: 14.02.08
Wohnort: Ulm
Version: R2012b
     Beitrag Verfasst am: 27.11.2013, 19:52     Titel:
  Antworten mit Zitat      
Hallo

so vielleicht:

Code:


tline = {'<Name>Fahrer XYZ</Name>';
'<Connected>1</Connected>';
'<VehFile>126_TEAM_XYZ.VEH</VehFile>'
'<UpgradeCode>26000000 00000000</UpgradeCode>';
'<VehName>126 Team XYZ</VehName>'}

[tokens] = regexp(tline,'<(\w+).*>(?<value>.*?)</\1>','tokens')
tokens = cat(1,tokens{:});
tokens = cat(1,tokens{:});

tag_name = tokens(:, 1)
value     = tokens(:, 2)


 
Private Nachricht senden Benutzer-Profile anzeigen
 
DSP
Themenstarter

Forum-Meister

Forum-Meister



Beiträge: 2.117
Anmeldedatum: 28.02.11
Wohnort: ---
Version: R2014b
     Beitrag Verfasst am: 27.11.2013, 21:21     Titel:
  Antworten mit Zitat      
Danke Denny...das funktioniert!
Private Nachricht senden Benutzer-Profile anzeigen
 
Neues Thema eröffnen Neue Antwort erstellen



Einstellungen und Berechtigungen
Beiträge der letzten Zeit anzeigen:

Du kannst Beiträge in dieses Forum schreiben.
Du kannst auf Beiträge in diesem Forum antworten.
Du kannst deine Beiträge in diesem Forum nicht bearbeiten.
Du kannst deine Beiträge in diesem Forum nicht löschen.
Du kannst an Umfragen in diesem Forum nicht mitmachen.
Du kannst Dateien in diesem Forum posten
Du kannst Dateien in diesem Forum herunterladen
.





 Impressum  | Nutzungsbedingungen  | Datenschutz | FAQ | goMatlab RSS Button RSS

Hosted by:


Copyright © 2007 - 2025 goMatlab.de | Dies ist keine offizielle Website der Firma The Mathworks

MATLAB, Simulink, Stateflow, Handle Graphics, Real-Time Workshop, SimBiology, SimHydraulics, SimEvents, and xPC TargetBox are registered trademarks and The MathWorks, the L-shaped membrane logo, and Embedded MATLAB are trademarks of The MathWorks, Inc.