Een computer elke letter en symbool van tekst slaat als een opeenvolging van bits - binaire enen en nullen . Systemen die coderen voor het alfabet , leestekens en andere symbolen geëvolueerd tijdens de 20e eeuw , wat leidt tot ANSI en Unicode . ANSI , die eerder zijn ontstaan , maakt gebruik van minder bits maar herbergt niet-Europese talen met moeite ; Unicode omvat vele Aziatische en Midden - Oosten karakters evenals de Romeinse set gebruikt voor Engels en andere Europese talen . Maat ANSI set codeert tekens met acht bits of een byte , dus kan maximaal 256 verschillende symbolen tegelijk . De Unicode- systeem maakt gebruik van 16 bits , of twee bytes , opvang van 256 x 256 of 65.536 symbolen . Daarnaast Unicode heeft 17 coderende gebieden , waardoor een totaal van meer dan 1 miljoen symbolen. Voor talen met niet - Romeinse tekensets , ANSI maakt gebruik van een extra 16 - bits getal heet een code pagina . Een computer slaat dit nummer een keer , niet met elk karakter , het geven van meer flexibiliteit om de ANSI- codering regeling . Talen De ANSI- set bekend als " Windows 1252 , " waar " 1252 " verwijst naar de code paginanummer , is de meest populaire , die Engels en verschillende Europese talen . Andere code pagina's definiëren de extra talen , zoals 1254 voor Turkse en 1255 voor het Hebreeuws. Unicode , vanwege zijn grotere tekengrootte , inherent herbergt meer symbolen , waaronder die voor Thaise , braille , Cherokee en oude Perzische . Platforms ANSI groeide van Microsoft's Windows-besturingssysteem , die is ontwikkeld door Microsoft en IBM . Onderzoekers van Apple en Xerox samen aan Unicode , die Microsoft later vastgesteld. Op het moment van publicatie , Windows ondersteunt zowel ANSI en Unicode . Mac OS X gebruikt zijn eigen acht - bits teken code , vergelijkbaar met ANSI , en ondersteunt ook Unicode . Het Linux-besturingssysteem biedt ook ondersteuning voor Unicode . Sorting De Romeinse tekenset is van oudsher konden gebruikers informatie met behulp van de volgorde van zijn personages ordenen en sorteren . ANSI codes volgde het Latijnse alfabet orde , dus de waarde van een "T " is groter dan die van een "B ", waardoor computertaken zoals sorteren nagenoeg automatisch. Hoewel Unicode kan ook informatie zijn gebaseerd op de aard volgorde te sorteren is een complex proces . De eerste 127 Unicode- tekens zijn hoofdletters en kleine letters Romeinse letters , zodat sortering voor Engels en andere Europese talen . Elke niet-Romaanse taal heeft zijn eigen soort formule of algoritme .
|