Unicode Transformation Format ( UTF - 8 ) är en teckenkodning format som använder åtta - bitars block för att representera ett tecken , och används ofta i datorsystem . Den innehåller samma kompakta klartext kodning som ASCII-format , men även möjliggör kodning av specialtecken . Detta ger ytterligare funktioner , men innebär utmaningar när det används i programkod . De senare versioner av Perl fartyg med kodning moduler och en binmode funktion som gör det programmeringsspråk att hantera kodning och avkodning av UTF - 8 -filer . Ingång och utgång till /från ett Perl -program kan göras för att hantera UTF-8- tecken med hjälp av en omkopplare på kommandoraden . Saker du behöver
ActiveState Perl
Perl redaktör
Visa fler instruktioner
1
starta Perl editor för att börja koda Perl -programmet . Du kan använda en enkel textredigerare , till exempel Anteckningar i Windows eller editorn vi på UNIX . Du måste spara filen med ett . Pl förlängning så att systemet kommer att kunna känna igen den som en Perl -program .
2
Placera en nödvändighet för att kräva " Koda " modulen i toppen av Perl -programmet . Du kommer att kunna använda kodning och avkodning funktioner i kroppen av Perl -program för att koda /avkoda data till /från UTF - 8 -format som krävs . Skriv följande i Perl editor för att använda denna metod :
# /usr /bin /perlrequire Koda , Alternativt kan du ringa Koda modulen , enligt följande : använd Koda , att koda data skulle du skriva följande i brödtexten i ditt program : $ utgång = koda :: koda ( " utf8 " , $ string ) ;
3
Ange UTF - 8-kodning format när du öppnar ett fil. Du kan göra detta genom att skriva någon av följande format i redigeraren :
öppna filen " < : kodning ( iso -8859- 7) " , $ indatafil ,
öppen fILE , " < : utf8 " . , $ indatafil ,
Detta kommer att berätta Perl att koda filen i UTF - 8 -format , eller att förbereda för UTF - 8-kodning
4
Ange " binmode " när du läser eller skriver filer , för att säkerställa att filerna är kodade i UTF - 8 -format .
att ställa in binmode till UTF - 8 när man läser en fil skriver du följande till redaktören : $ filename = " filnamn.typ " , $ indatafil = IO :: Arkiv - > nya ( $ filnamn , "r" ) ; binmode ( $ indatafil , " : utf8 ');
för att ställa in binmode till UTF - 8 när du skriver till en fil skriver du följande i redigeraren : $ filename = " filnamn.typ " , öppen ( UT , " > $ filename " ) ; binmode ( OUT " ; : utf8 " ) ;
Du kan också använda binmode att ställa in formatet på standard input och output till UTF - 8 , på följande sätt : binmode ( STDIN , ' : utf8 '); binmode ( STDOUT , ' : utf8 ');