Nutch und UTF-8

Innerhalb der Nutch-Oberfläche wird die GET Methode benutzt, um die Suchanfrage an den Server zu übermitteln. Der Tomcat interpretiert die URL per Standard als ISO 8859-1. Dadurch gehen unter anderem deutsche Umlaute verloren.

(mehr …)

WeiterlesenNutch und UTF-8