Zum Inhalt springen

automatische Verschlagwortung


Yoah

Empfohlene Beiträge

Tach auch!

Bin hier ganz schön neu und habe direkt eine Frage!

Kennt jemand Tools/Programme für eine automatische Verschlagwortung?

Ein paar habe ich schon gefunden, aber leider sind alle in

Content oder Document Management Systemen eingebettet.

Ich muss eine Liste mit Vergleichen aufstellen, damit ich sagen kann,

warum eine selbst programmierte Lösung zu empfehlen ist!

Danke im voraus!

Link zu diesem Kommentar
Auf anderen Seiten teilen

Wofür willst Du Schlagwörter bilden (Bücher, Texte?) und da das automatisch geschenen soll, woraus und nach welchen Kriterien?

Momentan sieht es so aus, dass ich gar nicht weiß, was das für Texte sind, bzw. sein sollen.

Ich habe momentan Dokumente in Form von HTML.

In diesen html-dateien sind Texte, die analysiert werden sollen (die Verschlagwortung),

Das Kriterium bei der Sache ist, das ich nur ne Tabelle mit den Ausschluss-Wörtern

bekomme und die Wörter die dann quasi übrig bleiben, sind meine Schlagwörter.

Die Schlagwörter müssen dann der Datei zugeordnet werden. Taucht das gleiche Schlagwort noch in einer anderen Datei auf, muss diese Datei dem Schlagwort zugeordnet werden.

Mehr weiß ich auch noch nicht, so suche ich mir seit gestern morgen schon den Wolf, nach einem vergleichbaren ETWAS, das dem nahe kommt.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Gut, Du willst dann aber keine Schlagwörter erstellen, sondern einen Index über die Wörter von Texten bilden, um die Stellen (oder Texte) in denen die Einträge vorkommen, zu finden. Schlagwörter sind in der Regel wenige Begriffe, die den Inhalt eines Textes kategorisieren, so dass man z.B. in einer Bibliothek Bücher zu einem Thema findet. So etwas kann man IMO nicht automatisieren. Einen Index bauen hingegen schon.

Das was Du machen willst (Index über Wörter mit Ausschlußwörterbuch für zu häufige Begriffe) ist vom Prinzip her das, was Suchmaschinen machen. Die Idee ist einfach zu verstehen, die Umsetzung für sehr große Textmengen (WWW-Suchmaschine) schwer.

Grundsätzlich mußt Du eine Liste über die Index-Wörter bilden, bei dem dann jeder Eintrag auf die Dokumente, in denen das Wort auftritt verweist.

Was möchtest Du denn genau dazu wissen?

Link zu diesem Kommentar
Auf anderen Seiten teilen

Ich möchte wissen, ob es für so etwas schon Tools, oder Programme gibt,

die eine Indexierung oder Verschlagwortung automatisch generieren.

Gefunden habe ich nämlich noch gar keine, es sei denn, diese automatische

Verschlagwortung war in CMS/DMS inbegriffen.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Klar gibt es so etwas. Ich z.B. bin gerade mit etwas so ähnlichem beschäftigt, wenn auch in einem komplett anderen Zusammenhang. Der Index ist dabei immer nur das Mittel zum Zweck.

Als fertiges Programm wirst Du einen reinen Index-Generator sicherlich nicht finden, denn nur den Index zu erstellen ist für sich alleine sinnlos. Erst wenn man an den Index Anfragen stellt, macht es Sinn. Ich vermute Du wirst so etwas im Bereich der Dokumenten-Indizierung finden (Volltextsuche). Deswegen bist Du sicherlich auch auf Dokumenten-Management-Systeme gestoßen.

Ich glaube Google stellt eine Intranet-Search-Appliance her, IMO gab es auch einmal von AltaVista eine Such-Software. Gibt es sicher auch noch von anderen Anbietern. Damit könntest Du evtl. Deine HTML Dokumente durchsuchbar machen. Ich weiß ja nicht, was die Anforderungen sind (Zahl der Dokumente und deren Größe).

Link zu diesem Kommentar
Auf anderen Seiten teilen

Morgen!

@ Bubble, sonst ist zwar keiner aktiv hier, aber egal.

Ich habe dann gestern am späten Nachmittag noch erfahren,

das diese automatische Verschlagwortung bei einem von

unserer Firma gemachten DMS eingesetzt werden soll.

Konnte aber nicht mehr hier reinschreiben! Sorry!

Und der Ablauf des Ganzen soll so aussehen:

Ich habe nen Ordner mit Dokumenten,

den ich dann angebe, lasse dann nen Algorithmus, den ich noch nicht habe, drüberlaufen.

Dabei heraus kommen soll dann z.B:

Schlagwort

Abfall

Datei-Titel

Müllverbrennung

Abfallbeseitigung

Containerstandorte

.....

Schlagwort

Gebäude

Datei-Titel

Haus A

Halle

Lager

So etwas ungefähr soll dabei herumkommen!

Vielleicht ist es jetzt verständlicher, auch für mich!

Link zu diesem Kommentar
Auf anderen Seiten teilen

Moin,

ich wüßte nicht wie sich sowas komplett automatisieren lassen sollte.

Die Schlagworte wirst du wohl beim Einstellen des Dokuments ins DMS selbst vergeben müssen. Oder irgendwo eine allgemeine Schlagwortliste Pflegen und mit einer Volltextsuche verknüpfen.

Eine Volltextsuche, ist je nach Produkt natürlich automatisch möglich.

Ein Volltextsuche Produkt was man in eigene (Java) Anwendungen einbauen kann ist Lucene.

http://jakarta.apache.org/lucene/docs/index.html

Gruß Jaraz

Link zu diesem Kommentar
Auf anderen Seiten teilen

@Yoah:

Wenn es sich um Schlagworte im eigentlichen Sin handelt, dann wird man sie per Hand anlegen müssen, denn ein Computer kann den Inhalt von Texten nicht verstehen.

Ein Volltext-Index ist hingegen automatisch erstellbar, für große Zahlen an Dokumenten muß man sich aber schon einige Gedanken über die Realisierung machen. Letzlich könnte man die Index-Suche dann noch mit einer Art Thesaurus koppeln, um bei der Suche nach Müll auch nach dem Bergiff Abfall zu suchen, aber letzlich wäre das eine Erweiterung der Index-Suche.

Ich befürchte die Aufgabe ist, wenn Du sie alleine und richtig lösen willst und viele viele Dokumente zu verwalten hast, schwieriger, als Du Dir derzeit vorstellst ;-)

Link zu diesem Kommentar
Auf anderen Seiten teilen

  • 6 Jahre später...

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...