069 37306888 Anfahrt

Menü

Solr-Suche in TYPO3 einrichten

Schwächen der Standardsuche indexed search

Für kleine Webseiten bietet TYPO3 eine integrierte Suchfunktion: indexed_search. DIese ist einfach einzurichten und funktioniert auch zuverlässig. Nur leider ist eine Suchfunktion erst wichtig, wenn eine Website größer wird. Und dort fangen dann die Probleme an:

Bei umfangreicheren Webseiten bremst indexed_search das System recht schnell aus, da die Indexierung auch in der Datenbank erfolgt. Noch wichtiger sind aber die fehlenden Funktionen für eine moderne Websuche: die Suche nach Kriterien (facettierte Suche), Unterstützung bei falsch geschriebenen Suchbegriffen (Meinen Sie ...), das Definieren von Stopwörtern (und, ist...), die in der Suche nicht berücksichtigt werden oder eine Gewichtung der Suchkriterien sind nicht möglich.

Grundsätzlich ist die Standardsuche von TYPO3 - da Sie eine reine Volltextsuche ist - nicht in der Lage, nach mehreren Begriffen zu suchen. Eine Suchanfrage "TYPO3 Agentur" würde daher nur die Stellen finden, in denen der Text exakt in der Reihenfolge steht. Seiten mit den Begriffen "Agenturen für TYPO3", "TYPO3 Internetagenturen" oder "Webagentur für TYPO3" würden zum Beispiel nicht berücksichtigt werden.

SOLR-Extension für TYPO3

Eine gute Alternative zur Standardsuche ist die Extension Apache Solr für TYPO3. Sie basiert auf dem Apache Lucene Projekt. Für die Einrichtung ist ein SOLR-Server erforderlich. Viele Provider bieten SOLR-Server - ähnlich wie das normale Webhosting - für eine monatliche Pauschale an.

Einrichten der Extension

Die Extension wird über den Extensionmanager in Typo3 installiert und die Verbindung mit dem Solr-Core eingerichtet. Die verschiedenen Module für die Indizierung werden dann in Typoscript eingerichtet. Für die Indizierung der Texte auf den Seiten und die News-Extension ist die Unterstützung in den Typoscript-Templates der Extension eingerichtet. im HTML-Template müssen die Marker 

TYPO3SEARCH_begin und TYPO3SEARCH_end

eingebunden sein und die Indizierung auf der Webseite in Typoscript aktiviert sein.

config.index_enable = 1

Für andere Extension wird die Indizierung per Typoscript konfiguriert. Dabei kann auch die Gewichtung der Contenteelemente/ Extensions untereinander, aber auch die Gewichtung von Titel und Content verändert werden

Die Indizierung erfolgt über einen Cronjob, bei Änderungen an den Tabellen wird der entsprechende Datensatz wieder neu in die Index Queue gestellt, so dass die Suchergebnisse immer aktuell bleiben.

Suchmaske und Ergebnisanzeige

Die Suchmaske bietet neben den Suchfeld verschiedene Unterstützungen. So kann über die facettierte Suche z.B. ausgewählt werden,dass nur Suchergebnisse aus den News angezeigt werden. Oder unter der Suchmaske erscheint ein Vorschlag für eine alternative Suche. Auch die letzten oder besonders häufige Suchbegriffe können angezeigt werden.

Die Suchergebnisse zeigen neben dem Titel der Seite auch mit einer Grafik an, wie relevant das Suchergebnis für den gesuchten Begriff ist. Im Teaser-Text wird der Suchbegriff hervorgehoben, nicht relevante Sätze werden ausgeklammert.So kann der Besucher leichter erkennen, ob die Seite wirklich die gesuchten Informationen enthält. 

Indizierung von Dateien

Auch die Indizierung von pdf-Dateien auf dem Server ist mit Solr möglich. Hierfür werden die Extensions tika und solrfal eingebunden und konfiguriert. Hier ist es natürlich wichtig, dass die Metadaten der pdf-Dateien richtig gesetzt sind, damit die Dateien in den Suchergebnissen vernünftig angezeigt werden.