René Kriegler, Suchmaschine, Suchpotential

Während die Website-Betreiber in den letzten Jahren die Suchmaschinen-Optimierung ihrer Sites als nahezu überlebenswichtiges Muss akzeptiert haben, werden Suchfunktionen innerhalb der Sites häufig noch recht stiefmütterlich behandelt. Doch egal, ob es sich um eine Funktion zum Durchsuchen der Seiten einer Website oder um die Artikelsuche in einem Shop handelt – Suchfunktionen bieten ein sehr großes Potential, die Akzeptanz bei den Nutzern und den kommerziellen Erfolg der Site entscheidend zu verbessern. Die Auswertung des Nutzerverhaltens zeigt, dass die Suche dem Browsen als klassische Navigationsform innerhalb der Site immer stärker Konkurrenz macht und dass eine gut funktionierende und schnelle Suche für ca. 40% der Nutzer zu den wichtigsten Kriterien zählt, erneut in einem Online-Shop zu kaufen (s. JupiterResearch für Akamai, Retail Web Site Performance, http://www.akamai.com/dl/reports/Site_Abandonment_Final_Report.pdf).

Es ist zu beobachten, dass Startups ihre Sites häufig zunächst ohne den Einsatz einer Suchmaschine aufbauen. Das heißt, auch wenn z.B. eine Artikelsuche einen ihrer zentralen Anwendungsfälle darstellt, wird oftmals der Artikelbestand direkt in der Datenbank durchsucht. Dies ist natürlich erstmal nahe liegend und führt beim Aufbau einer Site schnell zu Ergebnissen. Im Folgenden sollen nun aus technischer Sicht die Möglichkeiten und Vorteile untersucht werden, die sich aus der Verwendung einer Suchmaschine gegenüber der Suche auf der Datenbank ergeben. Viele der dabei genannten Eigenschaften der Suchmaschine gelten nicht nur, wenn mittels der Suchmaschine eine direkte Datenbanksuche ersetzt wird, sondern auch, wenn eine Dokumentensuche implementiert wird. Die Betrachtung wird sich jedoch auf den Einsatz der Suchmaschine für Daten, die in einer Datenbank gehalten werden, konzentrieren.

Der Index macht den Unterschied

Wichtigstes Unterscheidungsmerkmal einer Suche über die Suchmaschine statt über eine Datenbank ist die Verwendung eines Suchindexes. Teil 2 dieses Artikels beschäftigt sich mit den Vorteilen, die ein solcher Suchindex mit sich bringt. Zunächst soll erläutert werden, wie dieser Index zustande kommt.

Ein Index in einer Suchmaschine kann nur sehr beschränkt mit Indizes verglichen werden, wie sie in Datenbanksystemen vorkommen. Beide Formen des Index werden erstellt, um einen schnellen lesenden Zugriff auf die Daten zu haben. Während dabei beim Datenbankindex in der Regel ein nicht weiter zerteilter Feldinhalt den Indexschlüssel bestimmt, können beim Suchindex die Inhalte weiter unterteilt werden. Dazu werden sie zunächst in Token aufgespalten. Dies entspricht in etwa dem Aufspalten in Wörter. Für die Verwendung als Indexschlüssel werden diese Token dann noch weiter hinsichtlich Schreibung und Wortformen normalisiert, bevor sie dann schließlich als Indexterme abgespeichert werden.

Diese Art der Index-Bildung steht zwar auch in einigen Datenbanksystemen – zumeist unter dem Stichwort „Volltextsuche“ – zur Verfügung. Dennoch sind die Möglichkeiten der Steuerung der Termbildung bei Suchmaschinen deutlich vielfältiger und flexibler, da hier die Regeln für die Bildung der Terme viel stärker beeinflusst werden können. Je nach Suchmaschine kann man die gewünschten Regeln entweder auswählen, selbst implementieren oder bestehende Regeln anpassen. Oft können darüber hinaus Tokens beim Indexieren eingefügt oder entfernt werden.

Suchmaschinen bieten normalerweise schon vordefinierte Regeln für die Termbildung an. Im kommerziellen Bereich erstrecken sich diese Regeln dann oft nicht nur auf mehrere Sprachen, sondern auch auf bestimmte Domains, wie z.B. „Retail-Shopkatalog“ oder „Finanzwesen“. Auf der anderen Seite kommen solche vorab bereitgestellten Lösungen an ihre Grenzen, wenn neuartige Geschäftsmodelle eine neue Domainspezifik mit sich bringen, insbesondere im Zusammenhang mit User-Generated-Content. Vor allem in diesen Fällen ist die Flexibilität der Suchmaschine zur Steuerung der Termbildung besonders wichtig. Ein weiterer Aspekt dieser Flexibilität ist auch, dass es möglich ist, mehrere Suchindexes über den selben Datenbestand zu erstellen, um somit die Suche für verschiedene Suchpfade (z.B. Artikel, Anbieter) zu optimieren.

Ein weiteres wichtiges Merkmal eines Suchindexes besteht darin, dass er in der Regel außerhalb von Transaktionen, die den Datenbestand in der Datenbank bearbeiten, aktualisiert wird. Die Aktualisierung eines Suchindexes kann asynchron, in einem separaten Prozess geschehen, wodurch die Indexaktualisierung nicht zu Verzögerungen führt, die durch den Nutzer beim Abspeichern der Daten bemerkt würden. Schlägt andererseits eine Aktualisierung des Index außerhalb einer Transaktion fehl, kann der Index stets mit Hilfe der in der Datenbank gehaltenen Daten repariert werden.

Welche Vorteile bringt nun die Verwendung eines eigenen Suchindexes mit sich? Dieser Fragestellung wird sich der zweite Teil dieses Artikels widmen.


Über den Autor

René Kriegler ist freiberuflicher Softwareentwickler und -architekt. Er hat sich darauf spezialisiert, Unternehmen beim Einsatz von Suchtechnologien in der Planung und Umsetzung zu unterstützen. Dabei stützt er sich auf seine langjährige Erfahrung als Entwickler, vor allem im Java-Enterprise-Bereich, als technischer Projektleiter und auf seine Ausbildung als Linguist. Über den Bereich Suche hinaus interessiert er sich für Recommendation-Technologien und Text-Mining

GD Star Rating
loading...
Vorsicht, Suchpotential! - Warum sich durch den Einsatz einer Suchmaschine der Erfolg einer Website steigern lässt – Teil 1: Was macht den Unterschied?, 5.0 out of 5 based on 1 rating
Alle Bilder in diesem Artikel unterliegen der Creative-Commons-Lizenz (Namensnennung-Keine Bearbeitung, CC BY-ND; Link zum rechtsverbindlichen Lizenzvertrag). Ausgenommen sind anders gekennzeichnete Bilder unter anderem von Panthermedia, Fotolia, Pixelio, Morguefile sowie Pressefotos oder verlagseigenes Bildmaterial.