De programmeertaal Python gebruikt reguliere expressies voor patroonherkenning . Programmeurs maken vaak gebruik van reguliere expressies om tekst te zoeken naar patronen van letters , symbolen en cijfers . De kracht van reguliere expressies komt van het feit dat ze niet worden gebruikt om te zoeken naar iets specifieks , zoals het woord 'hond' , in plaats daarvan , ze zoeken naar woorden die overeenkomen met een bepaald patroon , zoals e-mail domeinnamen . Bijvoorbeeld , kunt u Python gebruiken om de domeinnamen van een lijst van e-mailadressen met behulp van reguliere expressies te vervangen . Wat je computer moeten met programmeertaal Python geïnstalleerd Toon Meer Aanwijzingen 1 Open de IDLE teksteditor die meegeleverd wordt met de Python taal door te klikken op het pictogram . De IDLE teksteditor pictogram bevindt zich in de Python -map in uw geïnstalleerde lijst programma's ( onder Alle programma's in het menu Start van Windows , en binnen de map Programma's in OSX ) . Een lege broncode bestand wordt geopend in de belangrijkste editor venster kopen van 2 Neem de ' re ' module door het schrijven van deze lijn aan de bovenkant van de broncode bestand : . Import re < br > 3 Verklaar een string en wijst een aantal e-mailadressen aan het, zoals dit : emailadressen = ' [email protected] , [email protected] , Bruce @ cmail.com ' 4 Maak een reguliere expressie die zoekt naar alle mogelijke tekst permutaties in geldige e-mailadressen . Reguliere expressies werken door te zoeken naar een patroon van tekens in een tekenreeks . Het patroon dat u geïnteresseerd bent in is elke twee woorden samengevoegd door een @-symbool . Aangezien e- mailadressen hebben vele geldige tekens , wilt u alle mogelijke tekens in elk woord overeenkomen voor en na het @-symbool . Dit wordt bereikt met de reguliere expressie [ \\ w \\ - . ] , En door het toevoegen van een + aan het eind van het, kunt u dit herhalen voor alle karakters . De ingevulde reguliere expressie kunnen worden opgeslagen op een string als dit : regexPattern = r ' ( [ . \\ W \\ - ] + ) @ ( [ . \\ W \\ - ] + ) ' < br > 5 Maak een reguliere expressie die alle van de domeinnamen vervangt door " zmail.com . " In deze reguliere expressie , de volgorde terugverwijzing teken \\ 1 wordt gebruikt om het domein van de e-mailadressen vervangen . De terugverwijzing verwijst naar een locatie in een reguliere expressie omgeven haakjes . Door het toepassen van de reguliere expressie aan de eerste terugverwijzing , bespaart u het e-mailadres , maar gooi de oude domeinnaam . U kunt dan een nieuwe domeinnaam , zoals ' @ zmail.com . ' Om deze tweede reguliere expressie op te slaan in een variabele , kun je dit te schrijven : regexReplacement = r ' \\ [email protected] ' 6 Breng de reguliere expressies om de string met de e-mailadressen zoals deze : emailadressen = re.sub ( regexPattern , regexReplacement , emailadressen ) op Twitter Print 7 uit de e-mailadressen met behulp van deze regel code . Python 3 gebruikt deze syntax voor afdrukken : print ( emailadressen ) , terwijl Python 2 gebruikt deze syntax : druk emailadressen 8 Start het programma door op de F5-toets . . Het programma-uitvoer is : [email protected] , [email protected] , [email protected]
|