Python is een open - source , object - georiënteerde programmeertaal geoptimaliseerd voor het bouwen van dynamische webapplicaties . Bij het programmeren in Python , moet u HTML-opmaak scheiden van Python- code . Bijvoorbeeld kan een gebruiker een webpagina ingevoerd in een gegevensveld , waarbij u ontdoen van de HTML tags om de tekstuele gegevens. Naar HTML tags te verwijderen uit een string , gebruikt u de ingebouwde Python Regular Expression module , " Regex . " Instructies 1 Open uw Python -editor . Kopen van 2 Laad de Regular Expression module door het volgende te typen : import re 3 Definieer een functie om alle HTML- tags te verwijderen . Typ bijvoorbeeld het volgende : def delete_html ( data ) : 4 Scheid de HTML -code -elementen met behulp van de functie " re.compile " aan de reguliere expressie patronen compileren in een object dat u kunt gebruiken voor patroonherkenning . Voortzetting van het voorbeeld , type dit : htmlPattern = re.compile ( r ' < . ? * > ' ) Op Twitter In dit voorbeeld is de " re.compile " attribuut vertelt Python te zoeken naar de string " " < .. > " die het begin en het einde HTML -tags betekent . de qualifier ' . * ?' vertelt Python om alleen de tags aan te passen. Zonder de qualifier , Python retourneert de tekenreeks ' subkop < /h2 > " ; met de qualifier , Python returns" . En < /h2 > " 5 Vervang een ruimte voor alle HTML -code met behulp van de functie "sub " . Voortzetting van het voorbeeld , typt u het volgende : return htmlPattern.sub ( ' ' , data ) op Twitter In dit geval , Python strips uit de HTML-code en vervangt deze door een lege ruimte . Op dit moment , afhankelijk van hoe u de gegevens wilt structureren , kunt u de functie string " strip " gebruiken om spaties te verwijderen of reguliere expressies gebruiken , zoals " \\ s + , " om de extra spaties verwijderen . < Br >
|