Zum Inhalt springen

Hans W.

Mitglieder
  • Gesamte Inhalte

    5
  • Benutzer seit

  • Letzter Besuch

Beiträge von Hans W.

  1. Hi zusammen,

    Klassifikationsverfahren werfen ja zum Ende hin immer mit jeder Menge Daten um sich.

    Ich würde nun gerne mein gewähltes Klassifikationsverfahren durch entweder die ROC Kurve, oder den "cumulative lift" erklären / begründen.

    Was ist dafür besser geeignet?

    Wie könnte man außerdem "lift" übersetzen, damit ich mir etwas Hintergrundwissen zu dieser Kennzahl aneignen könnte? ;)

    vielen Dank

  2. Vielen Dank für die Hilfe und sorry, dass ich erst so spät antworte.

    Ich verstehe schon, dass viele Faktoren im Projekt eine Rolle spielen, welche die Strategie beeinflussen.

    Sagen wir mal, ich konkretisiere verschiedene Fragestellungen, wäre so etwas dann möglich? Also ich meine, ich könnte mir ja einige Projekte aus unserem Umfeld angucken, und mich daran orientieren. Da wurde die "Technik" ja sicherlich nicht wahllos ausgesucht. Allerdings würde ich diese Info im Moment lieber von "externen" Quellen bevorzugen, um unsere internen Cases vielleicht mal zu validieren.

    Sprich, ich sage einfach mal: Firma x bekommt jeden Tag 150 Mails, die an verschiedene "Sachbearbeiter" (je nach Problemstellung) geroutet werden sollen. Hier könnte man doch schon sagen, "naja, ein VSM wäre hier sicherlich etwas overkill, ein simpler Klassifikator tuts da ggfs auch...

    wenn die Accuracy nicht ganz so wichtig ist, könnte man da leicht ein statistisches Verfahren nehmen, wenn die Mails ein Precision and Recall Breakeven von 99% haben sollen, sollte man evtl. auf eine linguistische Lösung zurückgreifen..." (und das ganz natürlich mit Beweisen belegt).

    Ich hoffe jetzt wirds etwas klarer :)

    Hans

  3. Hallo flashpixx,

    vielen Dank für deinen Beitrag.

    Ich werde mir das Buch mal genauer angucken.

    Klar hab ich mir das mit dem Classifier jetzt etwas einfach gemacht. Aber ich wollte auch gar nicht so sehr auf die Techniken oder Resultate des Minings hinaus.

    Und ja, natürlich müssen immer wieder irgendwelche Faktoren beachtet werden, da es nicht Prozess X für "diese" Situation gibt. Aber es wird doch schon so etwas wie Orientierungsansätze geben.

    Mir ging es grundsätzlich eher um konzeptionelle Ansätze beim Aufbau eines DocWH, bzw. beim Prozess der "Befüllung".

    Banales Beispiel aus irgendeinem Lehrbuch: Zuerst sollten Eigennamen extrahiert werden, bevor Stoppwörter entfernt werden.

    Das ist zwar jetzt nur ein gaaanz kleiner Punkt in einem Unterprozess, aber es geht schon in die Richtung.

    Ich hoffe, dass ich mich etwas verständlicher ausgedrückt habe :)

    danke

  4. Hallo zusammen,

    Kurz zu meiner Person: Ich bin Hans, 25 Jahre aus Berlin und versuche mich gerade persönlich und beruflich eher in der Richtung Business Intelligence zu positionieren.

    Speziell gehts mir gerade ums Text Mining. Ich lese viele Bücher und habe schon viel gelernt. Jetzt solls für mich aber mal an die Praxis gehen: ich versuche mit verschiedenen Tools (OpenSource und das, was mir meine Firma so stellt) mal ein paar Dokumente zu Klassifizieren, Zusammenzufassen, Named Entities zu finden usw usf.

    An sich ist das ja alles mit diesen Drag n' Drop tools garnicht schwer. Ich suche nun allerdings umfassendere Prozessbeschreibung, die in der Vergangenheit schon gut funktioniert haben und an denen man sich ggfs. orientieren kann.

    Ein konkretes Ziel habe ich nicht. Mir gehts perspektivisch um Fragestellungen wie:

    "Soll ich in der Situation X lieber auf statische oder linguistische Mittel zurück greifen?" oder "Wann eignet sich was?".

    Irgendwie kommt mir das ganze Thema durch die Tools doch recht trivial vor, da man eigentlich nur irgendwelche sog. Knoten (z.B. baysian classifier) in ein Worksheet ziehen und es mit einem Dokument (oder mehreren) verknüpfen muss.

    Hoffe ihr könnt mir mit Tipps, Links oder Literaturempfehlungen weiterhelfen;)

    Auf eine gute Zusammenarbeit!

    Hans

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...