De twee belangrijkste onderdelen van een computerwoordenboek (of beter gezegd, een computer *lexicon* of *woordenlijst* die wordt gebruikt in zaken als spellingcontrole en autocorrectie) zijn:
1. De woordenlijst (woordenschat): Dit is de kerncomponent, die een lijst bevat van alle woorden die door het woordenboek worden herkend. Deze worden doorgaans op een sterk geoptimaliseerde manier opgeslagen, zodat u snel kunt zoeken.
2. (Optioneel) Bijbehorende gegevens: Dit deel kan informatie bevatten die verder gaat dan alleen het woord zelf. Dit kunnen zaken zijn als:
* Gedeelte van de toespraak: (zelfstandig naamwoord, werkwoord, bijvoeglijk naamwoord, enz.)
* Verbuigingsvormen: (meervoudsvormen, werkwoordvervoegingen)
* Definities: (hoewel minder gebruikelijk in kleinere woordenboeken die zich alleen op spellingcontrole concentreren)
* Frequentiegegevens: Hoe vaak een woord voorkomt in typische tekst.
Hoewel een eenvoudige woordenlijst voldoende is voor eenvoudige spellingcontrole, hebben meer geavanceerde toepassingen de bijbehorende gegevens nodig. Maar de woordenlijst zelf is altijd het fundamentele element. |