Zum Inhalt springen
View in the app

A better way to browse. Learn more.

Fachinformatiker.de

A full-screen app on your home screen with push notifications, badges and more.

To install this app on iOS and iPadOS
  1. Tap the Share icon in Safari
  2. Scroll the menu and tap Add to Home Screen.
  3. Tap Add in the top-right corner.
To install this app on Android
  1. Tap the 3-dot menu (⋮) in the top-right corner of the browser.
  2. Tap Add to Home screen or Install app.
  3. Confirm by tapping Install.

VB.net - Word-formatierung aus texten entfernen

Empfohlene Antworten

Veröffentlicht

Hallo leute,

folgendes Problem liegt vor: es werden texte aus Word in ein (nicht von mir entwickeltes) Programm eingegeben und in einer db gespeichert. dummerweise werden die Word-Formatierungsangaben als Text mitkopiert und in der DB gespeichert. ich soll nun diese Strings auslesen und alle formatangaben herauslöschen um nur den reinen text zu bekommen.

weiß jemand dafür eine Umwandlungs-Klasse oder eine feste definition anhand derer ich Word-Formatangaben erkennen kann?

danke

lg

jasso

  • Autor

der word-text wird von verschiedenen kunden in ein programm eingegeben und auch von dem programm in der db gespeichert.

ich habe leider nicht die möglichkeit allen kunden zu sagen dass sie den word-text vorher in den editor und dann vom editor in das programm kopieren sollen.

jetzt soll ich nach möglichkeit die felder der db nachträglich bearbeiten.

lg

jasso

du könntest ja via automatisierung auf das dokumentmodell der einzulesenden datei zugreifen und dort z.b. nur die paragraphs- oder alle benannten abschnitte auslesen - das hängt aber davon ab, wie dein dokument aufgebaut ist. word 2003 kann dokumente z.b. als XML speichern, dies wäre eine möglichkeit; oder aber eben über die automatisierung/interop von VB.NET:

Dim oPara As Microsoft.Office.Interop.Word.Paragraph

oPara = WordDoc.Content.Paragraphs...

s'Amstel

der word-text wird von verschiedenen kunden in ein programm eingegeben und auch von dem programm in der db gespeichert.
Die Frage ist doch, warum das Programm überhaupt die Formatierungen annimmt, wenn es nur unformatierten Text verarbeiten soll.

jetzt soll ich nach möglichkeit die felder der db nachträglich bearbeiten.
Wie sehen diese Formatangaben denn aus? RTF? Zeig mal ein Beispiel.
  • Autor

hmmm ... ich glaube mein problem ist noch nicht ganz richtig rübergekommen.

ich habe keine möglichkeit das kopieren durch den kunden aus word zu beeinflussen. der kunde wird weiterhin im word seine texte kopieren und in sein programm übertragen, wodurch ich auf jeden fall die word-texte inclusive den formatierungen in textform in der db stehen habe.

was ich nun benötigen würde wäre eine klasse oder definition zum filtern dieser texte und löschen der textuell dargestellten word-formatierungen.

Edit.: beispiel folgt gleich.

lg

jasso

Edit. Nr.2: ok ... danke für eure mühen leute. mir wurde gerade mitgeteilt dass es sich bei den angeblichen format-angaben nicht um word-formatierungen handelt, sondern die verunstaltung des textes durch das kopieren aus einer citrix-remotesitzung entstehen. (ich hoffe dass es dabei bleibt. wenn nicht meld ich mich nochmal :hells: )

Archiv

Dieses Thema wurde archiviert und kann nicht mehr beantwortet werden.

Configure browser push notifications

Chrome (Android)
  1. Tap the lock icon next to the address bar.
  2. Tap Permissions → Notifications.
  3. Adjust your preference.
Chrome (Desktop)
  1. Click the padlock icon in the address bar.
  2. Select Site settings.
  3. Find Notifications and adjust your preference.