Artikel mit ‘Nutch’ getagged

Nutch und UTF-8

Samstag, 12. Juli 2008

Innerhalb der Nutch-Oberfläche wird die GET Methode benutzt, um die Suchanfrage an den Server zu übermitteln. Der Tomcat interpretiert die URL per Standard als ISO 8859-1. Dadurch gehen unter anderem deutsche Umlaute verloren.

(more…)

Nutch: Treffer pro Site

Mittwoch, 19. September 2007

Screenshot Nutch Die Nutch Standardkonfiguration zeigt pro Website 2 Treffer an. Der zusätzliche Schritt den Button “Alle Treffer anzeigen” verwenden zu müssen, ist bei kleineren Indexes nicht immer gewollt. In der Datei TOMCAT_ROOT/webapps/nutch/search.jsp kann man den Wert für hitsPerSite auf “-1″ setzen und dieses Verhalten umgehen.