Een zoekmachine kan worden opgesplitst in drie hoofdonderdelen:
1. Crawler (of Spider): Dit is het onderdeel dat automatisch op internet surft, links van pagina naar pagina volgt en informatie verzamelt over elke pagina die het bezoekt. Deze informatie omvat de inhoud van de pagina, links op de pagina en metagegevens (zoals titel en beschrijvingen).
2. Indexer: Dit onderdeel ontvangt de onbewerkte gegevens die door de crawler zijn verzameld en organiseert deze in een gestructureerde database. Deze database maakt snel en efficiënt zoeken mogelijk. De indexer analyseert de inhoud van elke pagina en identificeert trefwoorden, woordgroepen en andere relevante informatie die helpt bij het bepalen van de relevantie van de pagina voor specifieke zoekopdrachten.
3. Zoeker (of queryprocessor): Dit is het onderdeel dat de zoekopdracht van een gebruiker uitvoert, interactie heeft met de index en de meest relevante resultaten ophaalt op basis van algoritmen en rangschikkingsfactoren. Vervolgens worden deze resultaten in gerangschikte volgorde aan de gebruiker gepresenteerd. |