Textkomprimeringstekniken som ersätter ofta använda ord med ett enda tecken kallas
Substitution .
Så här fungerar det:
1. Identifiera ofta ord: Algoritmen analyserar texten och identifierar ord som visas oftast.
2. Tilldela enstaka tecken: Varje frekvent ord tilldelas ett unikt enstaka tecken (vanligtvis inte en del av det ursprungliga alfabetet).
3. Byt ut ord: Den ursprungliga texten skannas sedan och varje frekvent ord ersätts med dess tilldelade enstaka tecken.
4. lagra kartläggningen: Kartläggningen av tecken till ord lagras separat, så att den kan användas för att dekomprimera texten senare.
Exempel:
Låt oss säga att de frekventa orden i en text är "The", "och" "är" och "till."
* Mapping:
* "" -> 'a'
* "och" -> 'B'
* "är" -> 'C'
* "till" -> 'd'
* komprimerad text: "Det här är en fantastisk dag b Det är soligt att gå ut."
Obs: Denna teknik är enkel men ofta inte särskilt effektiv för att komprimera stora mängder text. Det kan vara mer effektivt när det kombineras med andra tekniker som kodning av körlängd.