14. Dezember 200421 j Hallo zusammen, ich möchte eine Internet-Applikation mit einer Volltextsuche ausstatten. Folgende Rahmenbedingungen müssen erfüllt werden: 1.) Die zu indexierenden Inhalte kommen aus einer Datenbank 2.) Die Suchanfrage sollte Wildcards (am besten reguläre Ausdrücke) beherrschen 3.) Ich kann keine in Datenbanken eingebaute Suche verwenden (z.B. von MySQL), da die Applikation DB-unabhängig ist 4.) Die Indexierung sollte mit verschiedenen Sprachen umgehen können (deutsch, englisch, spanisch...) und dazu auch in der Lage sein Stopwörter für die Sprachen definieren zu können und auch Wörter in Ihre Stammform zurückzuführen (Lokomotiven -> Index: Lokomitive) 5.) Die Suchergebnisse sollten gewichtet sein, d.h. bessere Treffer am Anfang 6.) Der Index kann sowohl in einer Datei, als auch in einer DB gespeichert werden, das ist kein Problem Bisher hab ich noch nix gefunden, was mir wirklich weiterhilft. Habt Ihr Tipps?
14. Dezember 200421 j Hi, schau dir mal Lucene an: http://jakarta.apache.org/lucene/docs/index.html aktuelle Literatur als kauf ebook: https://secure.manning.com/catalog/view.php?book=hatcher2 Gruß Jaraz
14. Dezember 200421 j Hi, Lucene ist eine reine Java Lösung oder? Also als Punkt 7 auf der Liste 7.) Muss entweder mit PHP oder Perl abfragbar sein Oder geht da mit Lucene auch??
14. Dezember 200421 j Lucene ist eine reine Java Lösung oder? Ja, aber kannste ja in PHP über ein include einbinden. Also als Punkt 7 auf der Liste 7.) Muss entweder mit PHP oder Perl abfragbar sein Oder geht da mit Lucene auch?? Es gibt einen Perl Port, von einer früheren Lucene Version. Der dürfte aber nicht im entferntesten die Features bieten. Ansonsten kenne ich im Bereich PHP nichts was die gewünschten Features bietet. Gruß Jaraz
14. Dezember 200421 j notfalls musst du das Java Programm per PHP-Schnittstelle ansprechen: http://de.php.net/manual/de/ref.java.php
15. Dezember 200421 j Also ich hab Xapian gefunden (www.xapian.org). Das sieht super aus. Scheint alles zu können, was ich brauche.
Archiv
Dieses Thema wurde archiviert und kann nicht mehr beantwortet werden.