Index

Als Index einer Suchmaschine wird der komplette Bestand an Seiten bezeichnet, die die Suchmaschine mit Hilfe ihres Robot besucht und auf den eigenen Servern gespeichert hat. Die großen Suchmaschinen wie Google haben heute einen Index, der aus zig Milliarden Seiten besteht. Diese Seiten werden auf tausenden von Rechnern gespeichert und liegen typischerweise in einem proprietären Datenformat vor. Denn handelsübliche (relationale) Datenbanken sind nicht in der Lage, die anfallende Menge an Daten zu speichern und mit der notwendigen Geschwindigkeit wieder zur Verfügung zu stellen. Der Index einer Suchmaschine ist also eine hochspezialisierte Datenbank, die genau auf die Anforderungen von Suchmaschinen zugeschnitten ist.