Zum Inhalt springen

Umwandlung einer PDF-Datei in eine TXT-Datei


DFBL-Benjamin

Empfohlene Beiträge

wer kennt ein Tool, womit man PDF-DAteien umwandeln lassen kann, in das TXT-Format?

wenn ich das mit ACROBAT-REader mache, dann werden einfach mal Leerstellen eingefügt, wo in der PDF-DAtei nicht sind. Da sind die Uhrzeit zusammen geschrieben, aber dann in der TXT-Datei sieht dass dann so aus: 19: 00 und das wäre dann 2 Arrays, statt 1!

HOffe, jemand kennt ein sehr einfaches Tool, womit man PDF-Dateien umwandeln lassen kann.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Wie wandelst du denn mit welchem Reader auf welchem Betriebssystem pdf in txt um?

Der Reader ist ein reiner Viewer. Verarbeitungsfunktionen hat der nicht.

Mit der Board-Suchfunktion lassen sich solche Sachen auch finden.

http://forum.fachinformatiker.de/showthread.php?t=78909

http://forum.fachinformatiker.de/showthread.php?t=59049

Link zu diesem Kommentar
Auf anderen Seiten teilen

ich habe WinXP und habe ACROBAT 5.0!

ich habs mit der Funktion dort umgewandelt, aber da werden bei zusammenhängenden Sachen, wie der Uhrzeit, einfach ein Leerzeichen eingefügt.

deshalb bin ich jetzt auf der Suche nach einem anderen Tool, wo das nicht macht!

habe bis jetzt noch nichts gefunden, wo mich weiterbringt!

ich habe schon einige Heruntergeladen, aber bis jetzt hat nur eins überzeugt, das nur über die Konsole läuft. Das ist recht umständlich!

Link zu diesem Kommentar
Auf anderen Seiten teilen

wenn ich das mit ACROBAT-REader mache...

ich habe WinXP und habe ACROBAT 5.0!
Könntest du dich bitte mal drauf einigen und deutlich schreiben, welche Version vom Acrobat du verwendest?

Acrobat Reader oder die Vollversion, die auch *.pdf erstellen kann?

Aus welcher Quellanwendung kommen denn die Daten? Also die Ursprungsdatei, die dann in *.pdf umgewandelt wurde?

Link zu diesem Kommentar
Auf anderen Seiten teilen

Wie wandelst du denn mit welchem Reader auf welchem Betriebssystem pdf in txt um?

Der Reader ist ein reiner Viewer. Verarbeitungsfunktionen hat der nicht.

Nicht ganz richtig, man hat im Reader auch ein Textmarkierung und kann über die Zwischenablage Text in ein Dokument, z.B. txt-Datei, kopieren.

Ich denke genau dies will er automatisiert realisieren bzw. zu verwenden.

Link zu diesem Kommentar
Auf anderen Seiten teilen

ich habe schon einige Heruntergeladen, aber bis jetzt hat nur eins überzeugt, das nur über die Konsole läuft. Das ist recht umständlich!

Also: Du sagst du hast ein Programm das recht gut Funktioniert dir aber von der Benutzeroberfläche zu kompliziert ist.

Wenn das Ding shareware oder freeware oder irgendsowas ist was man legal untereinander tauschen kann dann kannst mir das gern mal schicken und ich mach dir mit JAVA (falls JAVA auf deinen PC läuft) ne Benutzerobefläche dazu. Dürfte nicht wirklich kein Problem sein.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Nicht ganz richtig, man hat im Reader auch ein Textmarkierung und kann über die Zwischenablage Text in ein Dokument, z.B. txt-Datei, kopieren.
Ja, das geht, aber nicht immer sauber. Was bei mir Unklarheiten hervorruft ist:
ich habs mit der Funktion dort umgewandelt...
Solange nicht klar ist, wie der Export durchgeführt wird, kann eine Fehlersuche nicht stattfinden.
Link zu diesem Kommentar
Auf anderen Seiten teilen

Hallo DFBL-Benjamin,

Du könntest z.B. mal Ghostview nehmen, damit die pdf Datei öffnen, unter Bearbeiten Text extrahieren anwählen, die gewünschten Seiten auswählen und im darauf folgendem Dialogfenster die neue Datei mit .txt abspeichern.

Die aktuelle Version kannst Du kannst Dir hier kostenlos downloaden: http://www.cs.wisc.edu/~ghost/

Link zu diesem Kommentar
Auf anderen Seiten teilen

Die Informationen von der PDF-Dateien stammen von einer Internetseite, wo ich die Seite dann als PDF ausdrucken lasse, also mit der Vollversion von Acrobat 5.0. Damit lasse ich die PDF-Datei über das Druckprotokoll DISTILLER erzeugen.

Da ich eine PDF-Datei nicht weiterverarbeiten kann, möchte ich es in eine TXT-Datei umwandeln lassen. Da gibt es sehr viele verschiedene Möglichkeiten, bloß bei jedem sieht das anders aus. Deshalb bin ich halt noch auf der Suche nach der besten Lösung für mich.

Die Daten aus der TXT-Datei möchte ich dann mit PHP einlesen lassen und dann weiterverarbeiten.

gibt es noch andere Möglichkeiten eine HTML-Seite direkt in eine TXT-DAtei umwandeln zu lassen. Dann kann ich mir den Zwischenschritt mit der PDF-DAtei sparen. DAs wäre auch nicht schlecht.

Ich hoffe, dass die Version jetzt klar ist. Ich habe die ACROBAT Vollversion 5.0! Damit bearbeite ich die PDF-Dateien, oder kann es auch in eine TXT-Datei umwandeln lassen, bloß sauber macht er das nicht!

hoffe jemand kennt noch ein anderes Programm.

danke!

Link zu diesem Kommentar
Auf anderen Seiten teilen

ich habe jetzt festgestellt, dass das mit dem Druckprotokoll alles durcheinander gerät in der Zeile.

Wenn ich es jetzt die einzelne Zeile abgespeichert habe und dann die einzelne Zeile aufteilen will, also jede Leerstelle, dann funktioniert das nicht.

gibt es für diesen Vorgang noch andere TXT-Drucker?

oder sonstige Programme, wo ich dann von einer Internetseite eine TXT-Datei erzeugen lassen kann?

ich benutze den Firefox-Browser! Vielleicht gibt es dazu Plugins? werde mal nachschauen, aber vielleicht kennt ja schon jemand einen, dann her damit.

DANKE!

Link zu diesem Kommentar
Auf anderen Seiten teilen

Hallo DFBL-Benjamin,

also möchtest Du nun von PDF zu TXT oder z.B. HTML zu TXT?

Von PDF zu TXT geht es bei mir wunderbar auch mit Ghostview.

Von einer Internetseite zu TXT geht die vorgeschlagene Variante von hellslawyer; sieht allerdings so aus, als ob dieses nicht nach Deinen Wünschen ist.

Also suchst Du vielleicht so etwas ?: http://www.jafsoft.com/detagger/index.html

Dort kannst Du eine Internetseite in eine Text Datei umwandeln.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Hallo DFBL-Benjamin,

also möchtest Du nun von PDF zu TXT oder z.B. HTML zu TXT?

Von PDF zu TXT geht es bei mir wunderbar auch mit Ghostview.

Von einer Internetseite zu TXT geht die vorgeschlagene Variante von hellslawyer; sieht allerdings so aus, als ob dieses nicht nach Deinen Wünschen ist.

Also suchst Du vielleicht so etwas ?: http://www.jafsoft.com/detagger/index.html

Dort kannst Du eine Internetseite in eine Text Datei umwandeln.

Hallo

das Programm JAFSOFT übersetzt leider auch nicht alles so wie ich das gerne hätte.

kannst du mir mal erklären, was ich alles für GHOSTview installieren muss, dass der läuft?

am besten direkt mit Download-Link für die SACHEN, was ich installieren muss.

ich bekomme beim Installieren des GHOSTVIEW folgende Fehlermeldung: "Error 0 running command .\setup.exe". Was mache ich denn falsch? Dabei habe ich das Programm ftp://mirror.cs.wisc.edu/pub/mirrors/ghost/ghostgum/gsv47w64.exe runtergeladen. Ist dass das richtige, was sonst?

Link zu diesem Kommentar
Auf anderen Seiten teilen

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...