Unicode Transformation Format ( UTF - 8 ) is een karakter encoding formaat dat acht - bit blokken gebruikt om een personage te vertegenwoordigen , en wordt veel gebruikt in computersystemen . Het bevat dezelfde compacte platte tekst encoding als de ASCII-indeling , maar ook zorgt voor de codering van speciale tekens . Dit geeft het extra functionaliteit , maar vormt uitdagingen bij gebruik in programmacode . De latere versies van Perl schip met codering modules en een binmode functie die het mogelijk maken de programmeertaal om het coderen en decoderen van UTF - 8 bestanden. Input en output naar /van een Perl -programma kan worden gemaakt om UTF - 8 karakters verwerken door middel van een schakelaar op de opdrachtregel . Wat je nodig hebt ActiveState Perl Perl editor Toon Meer Aanwijzingen 1 Start de Perl- editor te starten coderen van de Perl-programma . U kunt een eenvoudige teksteditor , zoals Kladblok in Windows of de vi -editor op UNIX gebruiken . U moet het bestand opslaan met een . Pl extensie , zodat het systeem in staat om het te herkennen als een Perl-programma zal zijn . Place 2 een dwingende noodzaak om de " Encode " module aan de top nodig van het Perl -programma . U zult in staat zijn om de codering en decodering functies in het lichaam van de Perl -programma voor het coderen /decoderen van gegevens in /out van UTF - 8-indeling , zoals vereist . Typ het volgende in de Perl -editor om deze methode te gebruiken : # /usr /bin /perlrequire coderen ; U kunt het coderen module bellen , als volgt : ! Gebruiken coderen ; Om gegevens te coderen , typt u het volgende in het lichaam van uw programma : $ output = Encode :: coderen ( ' utf8 " , $ string ) ; 3 Specificeer de UTF - 8 encoding formaat bij het openen van een bestand . U kunt dit doen door het intypen van een van de volgende formaten in de editor : geopend FILE , " < : encoding ( iso -8859- 7) " , $ invoerbestand ; geopend fILE , " < : utf8 " . , $ invoerbestand ; Dit zal Perl om het bestand te coderen in de indeling UTF-8 , of voor te bereiden op UTF - 8-codering vertellen 4 Geef het " binmode " bij het lezen of schrijven van bestanden , om ervoor te zorgen dat de bestanden zijn gecodeerd in de UTF - 8-indeling . Om de binmode ingesteld op UTF - 8 bij het lezen van een bestand , typt u de volgende in de editor : $ filename = " filename.txt " ; $ invoerbestand = IO :: File - > new ( $ filename , "r" ) ; binmode ( $ invoerbestand , ' : utf8 ' ) ; om de binmode ingesteld op UTF - 8 bij het schrijven naar een bestand , typ het volgende in de editor : $ filename = " filename.txt " ; geopend ( OUT , " > $ filename" ) ; binmode ( OUT , " ; : utf8 " ) ; U kunt ook binmode gebruiken om het formaat van standaard input en output ingesteld op UTF - 8 , als volgt : binmode ( STDIN , ' : utf8 ' ) ; binmode ( STDOUT , ' : utf8 ' ) ;
|