Zum Inhalt springen
View in the app

A better way to browse. Learn more.

Fachinformatiker.de

A full-screen app on your home screen with push notifications, badges and more.

To install this app on iOS and iPadOS
  1. Tap the Share icon in Safari
  2. Scroll the menu and tap Add to Home Screen.
  3. Tap Add in the top-right corner.
To install this app on Android
  1. Tap the 3-dot menu (⋮) in the top-right corner of the browser.
  2. Tap Add to Home screen or Install app.
  3. Confirm by tapping Install.

Umwandlung einer PDF-Datei in eine TXT-Datei

Empfohlene Antworten

wer kennt ein Tool, womit man PDF-DAteien umwandeln lassen kann, in das TXT-Format?

wenn ich das mit ACROBAT-REader mache, dann werden einfach mal Leerstellen eingefügt, wo in der PDF-DAtei nicht sind. Da sind die Uhrzeit zusammen geschrieben, aber dann in der TXT-Datei sieht dass dann so aus: 19: 00 und das wäre dann 2 Arrays, statt 1!

HOffe, jemand kennt ein sehr einfaches Tool, womit man PDF-Dateien umwandeln lassen kann.

ich habe WinXP und habe ACROBAT 5.0!

ich habs mit der Funktion dort umgewandelt, aber da werden bei zusammenhängenden Sachen, wie der Uhrzeit, einfach ein Leerzeichen eingefügt.

deshalb bin ich jetzt auf der Suche nach einem anderen Tool, wo das nicht macht!

habe bis jetzt noch nichts gefunden, wo mich weiterbringt!

ich habe schon einige Heruntergeladen, aber bis jetzt hat nur eins überzeugt, das nur über die Konsole läuft. Das ist recht umständlich!

wenn ich das mit ACROBAT-REader mache...

ich habe WinXP und habe ACROBAT 5.0!
Könntest du dich bitte mal drauf einigen und deutlich schreiben, welche Version vom Acrobat du verwendest?

Acrobat Reader oder die Vollversion, die auch *.pdf erstellen kann?

Aus welcher Quellanwendung kommen denn die Daten? Also die Ursprungsdatei, die dann in *.pdf umgewandelt wurde?

Wie wandelst du denn mit welchem Reader auf welchem Betriebssystem pdf in txt um?

Der Reader ist ein reiner Viewer. Verarbeitungsfunktionen hat der nicht.

Nicht ganz richtig, man hat im Reader auch ein Textmarkierung und kann über die Zwischenablage Text in ein Dokument, z.B. txt-Datei, kopieren.

Ich denke genau dies will er automatisiert realisieren bzw. zu verwenden.

ich habe schon einige Heruntergeladen, aber bis jetzt hat nur eins überzeugt, das nur über die Konsole läuft. Das ist recht umständlich!

Also: Du sagst du hast ein Programm das recht gut Funktioniert dir aber von der Benutzeroberfläche zu kompliziert ist.

Wenn das Ding shareware oder freeware oder irgendsowas ist was man legal untereinander tauschen kann dann kannst mir das gern mal schicken und ich mach dir mit JAVA (falls JAVA auf deinen PC läuft) ne Benutzerobefläche dazu. Dürfte nicht wirklich kein Problem sein.

Nicht ganz richtig, man hat im Reader auch ein Textmarkierung und kann über die Zwischenablage Text in ein Dokument, z.B. txt-Datei, kopieren.
Ja, das geht, aber nicht immer sauber. Was bei mir Unklarheiten hervorruft ist:
ich habs mit der Funktion dort umgewandelt...
Solange nicht klar ist, wie der Export durchgeführt wird, kann eine Fehlersuche nicht stattfinden.

Hallo DFBL-Benjamin,

Du könntest z.B. mal Ghostview nehmen, damit die pdf Datei öffnen, unter Bearbeiten Text extrahieren anwählen, die gewünschten Seiten auswählen und im darauf folgendem Dialogfenster die neue Datei mit .txt abspeichern.

Die aktuelle Version kannst Du kannst Dir hier kostenlos downloaden: http://www.cs.wisc.edu/~ghost/

Die Informationen von der PDF-Dateien stammen von einer Internetseite, wo ich die Seite dann als PDF ausdrucken lasse, also mit der Vollversion von Acrobat 5.0. Damit lasse ich die PDF-Datei über das Druckprotokoll DISTILLER erzeugen.

Da ich eine PDF-Datei nicht weiterverarbeiten kann, möchte ich es in eine TXT-Datei umwandeln lassen. Da gibt es sehr viele verschiedene Möglichkeiten, bloß bei jedem sieht das anders aus. Deshalb bin ich halt noch auf der Suche nach der besten Lösung für mich.

Die Daten aus der TXT-Datei möchte ich dann mit PHP einlesen lassen und dann weiterverarbeiten.

gibt es noch andere Möglichkeiten eine HTML-Seite direkt in eine TXT-DAtei umwandeln zu lassen. Dann kann ich mir den Zwischenschritt mit der PDF-DAtei sparen. DAs wäre auch nicht schlecht.

Ich hoffe, dass die Version jetzt klar ist. Ich habe die ACROBAT Vollversion 5.0! Damit bearbeite ich die PDF-Dateien, oder kann es auch in eine TXT-Datei umwandeln lassen, bloß sauber macht er das nicht!

hoffe jemand kennt noch ein anderes Programm.

danke!

davon habe ich noch nie was gehört!

wo gibt es dazu Programme?

werde gleich mal mit Google, das Wörtchen eingeben.

Das mit Ghostview funktioniert bei mir nicht. Ich bekomme immer FEHLERmeldungen. Was muss ich denn da installieren?

In diesem Fall ist es doch viel einfacher, wenn man beispielsweise im Internet Explorer einfach unter Datei -> Speichern unter die Option "Nur Text (.txt)" auswählt. Datei benennen und schwuppdiwupp da ist ne reine TXT.

Grütze

hellslawyer

bloß ich benutze keinen Internet Explorer nur Firefox.

Ich werde das mit dem Druckprotokoll machen. Habe mir die Darstellung noch nicht so 100% angeschaut, aber sollte passen.

wenn die Darstellung nicht passen sollte, dann melde ich mich wieder!

ich habe jetzt festgestellt, dass das mit dem Druckprotokoll alles durcheinander gerät in der Zeile.

Wenn ich es jetzt die einzelne Zeile abgespeichert habe und dann die einzelne Zeile aufteilen will, also jede Leerstelle, dann funktioniert das nicht.

gibt es für diesen Vorgang noch andere TXT-Drucker?

oder sonstige Programme, wo ich dann von einer Internetseite eine TXT-Datei erzeugen lassen kann?

ich benutze den Firefox-Browser! Vielleicht gibt es dazu Plugins? werde mal nachschauen, aber vielleicht kennt ja schon jemand einen, dann her damit.

DANKE!

Hallo DFBL-Benjamin,

also möchtest Du nun von PDF zu TXT oder z.B. HTML zu TXT?

Von PDF zu TXT geht es bei mir wunderbar auch mit Ghostview.

Von einer Internetseite zu TXT geht die vorgeschlagene Variante von hellslawyer; sieht allerdings so aus, als ob dieses nicht nach Deinen Wünschen ist.

Also suchst Du vielleicht so etwas ?: http://www.jafsoft.com/detagger/index.html

Dort kannst Du eine Internetseite in eine Text Datei umwandeln.

Hallo DFBL-Benjamin,

also möchtest Du nun von PDF zu TXT oder z.B. HTML zu TXT?

Von PDF zu TXT geht es bei mir wunderbar auch mit Ghostview.

Von einer Internetseite zu TXT geht die vorgeschlagene Variante von hellslawyer; sieht allerdings so aus, als ob dieses nicht nach Deinen Wünschen ist.

Also suchst Du vielleicht so etwas ?: http://www.jafsoft.com/detagger/index.html

Dort kannst Du eine Internetseite in eine Text Datei umwandeln.

Hallo

das Programm JAFSOFT übersetzt leider auch nicht alles so wie ich das gerne hätte.

kannst du mir mal erklären, was ich alles für GHOSTview installieren muss, dass der läuft?

am besten direkt mit Download-Link für die SACHEN, was ich installieren muss.

ich bekomme beim Installieren des GHOSTVIEW folgende Fehlermeldung: "Error 0 running command .\setup.exe". Was mache ich denn falsch? Dabei habe ich das Programm ftp://mirror.cs.wisc.edu/pub/mirrors/ghost/ghostgum/gsv47w64.exe runtergeladen. Ist dass das richtige, was sonst?

Zu Ghostscript Installationsproblemen bitte einen eigenständigen Thread eröffnen!

ich mache das jetzt anders!

so wie es hellslawyer gesagt hat, ist es glaube ich am einfachsten und die Darstellung ist OK!

jetzt muss ich nur noch die Daten in eine Form bringen, dass ich es weiter verarbeiten und in eine Datenbank eintragen kann.

Archiv

Dieses Thema wurde archiviert und kann nicht mehr beantwortet werden.

Configure browser push notifications

Chrome (Android)
  1. Tap the lock icon next to the address bar.
  2. Tap Permissions → Notifications.
  3. Adjust your preference.
Chrome (Desktop)
  1. Click the padlock icon in the address bar.
  2. Select Site settings.
  3. Find Notifications and adjust your preference.