De tekstcompressietechniek die vaak gebruikte woorden vervangt door een enkel teken wordt substitutie genoemd .
Hier is hoe het werkt:
1. Identificeer frequente woorden: Het algoritme analyseert de tekst en identificeert woorden die het meest voorkomen.
2. Wijs enkele tekens toe: Elk frequent woord wordt een uniek enkel teken toegewezen (meestal geen deel uit van het originele alfabet).
3. Vervang woorden: De originele tekst wordt vervolgens gescand en elk frequent woord wordt vervangen door het toegewezen enkele teken.
4. Bewaar de toewijzing: Het in kaart brengen van tekens naar woorden wordt afzonderlijk opgeslagen, zodat het kan worden gebruikt om de tekst later te decomprimeren.
Voorbeeld:
Laten we zeggen dat de frequente woorden in een tekst "de" "en" "is," en "to" zijn.
* Mapping:
* "de" -> 'a'
* "en" -> 'b'
* "is" -> 'c'
* "tot" -> 'd'
* gecomprimeerde tekst: "Dit is een geweldige dag B it c sunny d ga naar buiten."
Opmerking: Deze techniek is eenvoudig maar vaak niet erg efficiënt voor het comprimeren van grote hoeveelheden tekst. Het kan effectiever zijn in combinatie met andere technieken zoals run-length codering. |