En dator lagrar varje bokstav och en symbol för text som en sekvens av bitar - binära ettor och nollor . System kodar alfabetet , skiljetecken och andra symboler utvecklats under 20-talet , vilket ledde till ANSI och Unicode . ANSI , som uppstod tidigare , använder färre bitar men rymmer icke - europeiska språk med svårighet , Unicode omfattar många asiatiska och Mellanöstern karaktärer såväl som den romerska set används för engelska och andra europeiska språk . Storlek
ANSI set kodar tecken med åtta bitar , eller ett byte av data , så den hanterar upp till 256 olika symboler i taget . I Unicode -systemet använder 16 bitar , eller två bytes , tillmötesgående 256 x 256 eller 65.536 symboler . Dessutom har Unicode 17 kodande plan , vilket sammanlagt mer än 1 miljon symboler . För språk med icke-latinska teckenuppsättningar , använder ANSI ytterligare 16 - bitars nummer som kallas en teckentabell . En dator lagrar detta nummer en gång , inte med varje karaktär , vilket ger större flexibilitet till ANSI kodning .
Språk
ANSI set känd som " Windows 1252 " där " 1252 " avser den kod sidnummer , är de mest populära , som omfattar engelska och flera europeiska språk . Andra teckentabeller definiera ytterligare språk , t.ex. 1254 för turkisk och 1255 för hebreiska . Unicode , på grund av dess större teckenstorlek , natur rymmer fler symboler inklusive de för thailändska , punktskrift , Cherokee och fornpersiska .
Platforms
ANSI växte från Microsofts Windows -operativsystem , efter att ha utvecklats av Microsoft och IBM . Forskare från Apple och Xerox samarbetat på Unicode , som Microsoft senare antogs . Vid tidpunkten för offentliggörandet , stöder Windows både ANSI och Unicode . Mac OS X använder sin egen åtta - bitars teckenkod , liknar ANSI , och även stöder Unicode . Operativsystemet Linux ger också stöd för Unicode .
Sortering
romerska teckenuppsättning traditionellt tillåts användare att organisera och sortera information med hjälp av order av sina karaktärer . ANSI -koder följde den romerska tecknet ordning , så värdet av ett " T " är större än ett " B ", vilket gör datorn uppgifter såsom sortering nästan automatiskt . Även Unicode kan också sortera information som baseras på karaktären beställning , är det en mer komplicerad process . De första 127 Unicode-tecken inkluderar övre - och nedre fall romerska bokstäver , som möjliggör sortering för engelska och andra europeiska språk . Varje icke - romerska språket har sin egen sort formel eller algoritm .