22. Januar 200322 j Hallo, habe ein Problem: ich möchte gern einen Programm schreiben mit dem ich aus einem HTML-Dokument bestimmte Elementinhalte rauslesen kann. Zum Beispiel: lese inhalt aus dem "<a> Tag" od. speicher mir alle "<a> Tags" in einem Map usw. Hat jemand einen Tipp welche Packages ich anschauen soll. Bitte nicht mit Reguläre Ausdrücke anfangen! Thx
22. Januar 200322 j Wie bitttttteeeeeee ???????????????????? :confused: :confused: :confused: :confused: :confused: Theoretisch würde es schon gehen aber das dauert ja ewig, wenn ich byte für byte mich durch das Dokument (die Dokumente) kämpfen müsste. Hab scho ne Lösung gefunden. JTidy heisst das Zauberwort. Trotzdem Danke.
23. Januar 200322 j Wenn ihr mal einen richtigen HTML Parser braucht, dann könnt ihr euch sowas mit ANTLR (einem Parser-Generator ) machen (www.antlr.org). Für HTML ist sogar ein Beispiel dabei, wenn ich mich nicht irre.
Archiv
Dieses Thema wurde archiviert und kann nicht mehr beantwortet werden.