tekst parsing tools bestaan voor systeembeheerders en webontwerpers die behoefte hebben om grote hoeveelheden tekst te zoeken naar de structuur en de organisatie van de computer , het systeem scripts bepalen of mark - up documenten . Snelle en vuile SED en Perl scripts gebouwd rond reguliere expressies zijn vaak genoeg voor eenvoudige banen , maar ontleden van complexe XML -documenten vereist een robuuster instrument , zoals de Python programmeertaal 's elementtree bibliotheek . Wat je nodig hebt Python 2.5 of hoger Toon Meer Aanwijzingen 1 Start een terminal sessie of , zo u wilt , opent de Python Integrated Development Environment , bekend als IDLE , die kan worden gevonden in de Python -map in je C-schijf ( Windows ) of de map Programma's (Mac ) . Controleer uw versie van Python door te typen python - v op de commandoregel prompt . Elementtree is onderdeel van de Python standaard bibliotheek als van Python 2.5 . Als je Python 2.4 of eerder , moet je het downloaden van de de belangrijkste Python pagina . Kopen van 2 Bepaal het type gegevens gecodeerd in een XML-document door het lezen van de wortel -tag . Op de command line prompt , belasting elementtree en de parse -functie met de volgende opdracht : > van elementtree.ElementTree import parse 3 Zoek het bestand dat u wilt ontleden en noteer het pad ten opzichte van die van de Python-interpreter , of het bestand gewoon verplaatsen naar de map Documenten . Stel een variabele voor het bestand , lees het in het geheugen en ontdek de aard van de gegevens in het bestand met het volgende commando : > boom = elementtree ( file = bestandsnaam ) > elem = tree.getroot ( ) > druk elem < br > Dit zal de aard van de gegevens die in een XML-document te onthullen .
|