Veröffentlicht 16. September 20168 j Moinsen, ich suche nach einer Lösung um mithilfe von C# eine pdf-Datei auszulesen. Gegen ist tatsächlicher Text in der Datei, also kein Bild. Google habe ich schon gefragt und auch auf 3 Ergebnisse gestoßen (iTextSharp, pdfsharp, PDFBox), aber ich finde keine Dokumentationen, das ganze soll als Ereignis alle 5 Minuten auf einem Server laufen. Hat da jemand von euch Erfahrung die er teilen kann? Welche kostenlose Erweiterung für VS könntet ihr empfehlen? LG Tician
16. September 20168 j iTextSharp und pdfbox sind Portierungen von Javaanwendungen. Hier fehlt noch die Transferleistung von Java nach C# zu übersetzen. Zu allen findet man aber auch ein paar Beispiele bzw. Doku im Netz. Z.B.: http://www.pdfsharp.net/wiki/WorkOnPdfObjects-sample.ashx Eine Empfehlung gebe ich nicht ab, da die Features variieren und usw. Probier sie aus. Als einzige VS Erweiterung kann ich dir nuget Empfehlen.
16. September 20168 j Lösung Ich habe mit ITextsharp zumindest beim Erstellen ganz gute Erfahrungen gemacht. Einarbeitung vorausgesetzt :-D Das lesen sieht aber recht simpel aus: http://www.schiffhauer.com/read-text-in-a-pdf-in-c-with-itextsharp/
16. September 20168 j PDF-Dateien kann man auch so ohne weiteres nicht auslesen. Das ist ein recht komplexes Dateiformat mit einer eigenen Syntax zur Textgestaltung. Hier ist eine recht gute Übersicht, was die das Format funktioniert. Daher würde ich dir schon raten, eine Bibliothek dafür zu nehmen. Wir selbst erstellen nur Listen als PDF-Datei aber dafür verwenden wir List&Label von Combit. Das Tool ist aber nicht kostenlos. Ansonsten hast du ja schon einige Biblitoheken genannt, die du verwenden könntest. Etwas eigenes zu schreiben halte ich für zu fehleranfällig.
16. September 20168 j Autor Ausprobiert und es funktioniert wirklich einwandfrei und kinderleicht, vielen Dank @Mttkrb
Erstelle ein Konto oder melde dich an, um einen Kommentar zu schreiben.