Datorer förstår inte text och symboler inbyggt . Istället använder de en kodning språk kallas Unicode för att översätta siffror och bokstäver till deras lämplig text och symboler , känd som en Teckenuppsättning . De vanligaste typerna av Unicode är UTF - 8 , UTF - 16 , ISO -8859-1 och ASCII . Det är en unik identifierare för varje text bokstav och en symbol i Unicode , som förblir konstant över olika operativsystem och programmeringsspråk . De flesta programmeringsspråk har inbyggda funktioner för att översätta mellan olika Unicode standard . Instruktioner
1
Översätt charset i PHP . Typ " utf8_decode ( $ data) , " där " $ uppgifter " pekar på UTF - 8 -kod . Den resulterande ISO -8859-1 teckenuppsättning matas ut .
2
Översätt charset i Perl. Typ " använder Koda QW ( from_utf8 to_iso88591 ) ,
from_to ( $ data," utf8 " , " iso -8859-1 " ) ; . " Ersätt " från - utf8 " med UTF - 8-kodad teckenuppsättning och " to_iso88591 " med önskad ISO -8859- 1 utgång .
3
Översätt charset i Python . Skriv följande kod .
Source_encoding = " utf - 8 "
string = utf8variable
string = string.encode ( source_encoding ) katalog
string = unicode ( string , " iso -8859-1 ' ) katalog
Ersätt " utf8variable " med variabel håller UTF - 8 teckenuppsättning .