c77ar
-
Gesamte Inhalte
2 -
Benutzer seit
-
Letzter Besuch
Inhaltstyp
Profile
Forum
Downloads
Kalender
Blogs
Shop
Beiträge von c77ar
-
-
Hallo zusammen,
mein Name ich Christian. Ich hänge gerade an folgendem Problem fest: Per OCR werden bestimmte Bereich in einem Dokument gescannt. Per RegEx sollen nun teile davon ausgelesen werden.
Der OCR Text lautet (zum Beispiel) wie folgt:
Bauvorhaben: HV Musterverwaltung - Projektbezeichnung B21-09498
Folgendes ist gegeben: das Wort "Bauvorhaben:" ist immer vorhanden und soll nicht übergeben werden.
Die Projektnummer "B21-09498" wird ebenfalls nicht benötigt. Diese ist aber Variabel und nach zwei Schemata aufgebaut: entweder "B" gefolgt von der Jahreszahl, Bindestrich und dann 5 Ziffern ODER "B" gefolgt von der Jahreszahl, KEIN Bindestrich und 6 Ziffern. Diese Projektnummer lese ich bereits für ein zweites Feld mit folgendem Ausdruck aus:
[B][0-9]{2}[-][0-9]{5}|[B][0-9]{8}
Das klappt wunderbar. Ich hänge nun, weil ich nicht weiß, wie ich die beiden beschriebenen Blöcke am Anfang und Ende aus der Suche ausschließe. Ich möchte lediglich den Bereich "HV Musterverwaltung - Projektbezeichnung" haben.
Bisher habe ich folgendes gemacht:
(?<=Bauvorhaben: ).*
Damit bekomme ich den gesamten String geliefert. Aber wie schließe ich nun die Projektnummer aus?
Vielleicht hab jemand von euch eine Idee.
Schönen Abend euch!
Gruß
Christian
PS Gibt es bei euch auch einen Bereich wo man sich Vorstellen darf?
Reguläre Ausdrücke - Bestimmte fixe und und bestimmte Variable Wörter ausschließen
in Algorithmik
Geschrieben
Hallo Leute,
sorry dass ich mich jetzt erst melde! Ich hatte leider einen familiären Zwischenfall der mich voll in Beschlag nahm.
Vielen Dank für eure Hilfe in dieser Sache!
Liebe Grüße
Christian