Zum Inhalt springen

Mediawiki: einzelne Suchergebnisse sind unvollständig


MartinSt

Empfohlene Beiträge

Wir haben ein MediaWiki 1.18.1 unter PHP 5.3.3 auf PostgreSQL 8.4.9 laufen.

Alles funktioniert soweit prima, auch die Suche allerdings tritt folgendes Phänomen auf:

Es gibt im Wiki einen Artikel mit dem Titel: Urlaubsvertretung. Dieser wird auch korrekt gefunden, wenn man nach Urlaubsvertretung sucht. Sucht man allerdings nur nach Urlaub, so werden einige andere Artikel gefunden, die das Suchwort enthalten, aber eben nicht der Artikel "Urlaubsvertretung". Sucht man nach anderen Worten, die in diesem Artikel enthalten sind, so wird er völlig korrekt gefunden.

Bei anderen Suchen ist ein ähnlich falsches Verhalten bisher noch nicht aufgefallen.

Kennt jemand dieses Probelm und evtl. auch einen Lösungsansatz?

Danke Martin

Link zu diesem Kommentar
Auf anderen Seiten teilen

Danke erstmal für die Unterstützung.

Nachdem ich mich einen Nachmittag durch die Mediawiki-Suche und die zugrundeliegenden PG-Datenbanken gewühlt habe, schaut es so aus:

In der o.g. Konfiguration erfolgt die Textsuche über die Postgres-Volltextsuche. (tsearch2)

Per Trigger wird beim Anlegen, Ändern usw. von Artikeln je ein tsvector für den Titel und jede Version des Artikels angelegt.

Diese tsvectoren werden dann in der Volltextsuche gegen das Suchwort abgeglichen.

Im konkreten Fall meines Artikels "Urlaubsvertretung" ist es nun so, dass weder im Titel noch im Text das Wort "Urlaub" als eigenes Wort auftritt sondern nur in Zusammensetzungen. (Urlaubsvertretung, Urlaubsantrag etc.)

In den tsvectoren taucht somit "Urlaub" nicht als eigener Begriff auf.

Ob das stemming-technisch so ok ist, kann ich noch nicht beurteilen.

Ich werde als nächste mal versuchen, etwas an der Postgres-Volltextsuche zu drehen oder diese ganz zu deaktivieren, da die potentielle Artikelanzahl überschaubar bleibt.

Link zu diesem Kommentar
Auf anderen Seiten teilen

  • 4 Wochen später...

Wir haben jetzt im Endergebnis eine (aufgebohrte) Extension eingesetzt.

Extension:RigorousSearch - MediaWiki

Diese sucht unabhängig vom Postgres-Stemming, was sich als eindeutig sinnvoller erweisen hat, da wir in den Artikeln einen hohen Anteil an fach- und firmenspezifischen Begriffen haben, für die das Stemming ungeeignet war.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...