Hoe te Schraap & Ontleed Adressen

Welkom op de Nederland Computer Kennisnetwerk!

Zoeken computer kennis

* Computer Kennis >> Programmering >> python Programming >> Content

Hoe te Schraap & Ontleed Adressen

schrapen en parsing zijn twee nauw verwante website data - mining praktijken . De meer algemene , parsing , verwijst naar het afbreken van de gegevens in zijn samenstellende delen . Wanneer uw middelbare school leraar Engels vroeg je om diagram zinnen , was je ontleden van de woorden van hen straffen voor hun woordsoorten . Schrapen meer specifiek betrekking op het ontleden van webpagina's voor bepaalde soorten data , in dit geval adressen . De programmeertaal Python en de " beautifulsoup " uitbreiding kan de gebruiker te schrapen en te ontleden websites in een paar regels code . Wat je nodig hebt
Python 2.6 of hoger
beautifulsoup 3.2
Toon Meer Aanwijzingen
1

Installeer beautifulsoup door het downloaden van de nieuwste versie van mollig software kan uitgepakt /unzip het bestand . Open een Terminal -venster en typ de volgende opdracht : My - iMac : ~ me $ python Downloads/BeautifulSoup-3.2.0/python setup.py install

Dit vertelt de Python interpreter om de beautifulsoup install script dat kan draaien te vinden in de map BeautfulSoup , dat is in de map Downloads kopen van 2

Typ python op de prompt raakte terugkeer en import beautifulsoup : . Mijn - iMac : ~ me $ python >>> import beautifulsoup
3

Voer het volgende script om een webpagina te openen en af te drukken elke Universal Resource Locator ( webadressen ) je zou kunnen vinden in een pagina : >>> import urllib2 >> ; > page = urllib2.urlopen ( " http://www.THE URL JE WILT HIER SCHAAFT " ) >>> soup = beautifulsoup ( pagina ) >>> soup.findAll ( ' a ' ) >>> print soup.strip ( ) >>> printThis script zal een webpagina te openen , ontleden de html , zoeken naar de tag waarin webadressen zijn ingebed , verwijder de tags en laat de tekst .

Previous: Hoe te Python Krijg een beelduitvoer Get

Next: How to: Methode voor Pylon Doel Montage

python Programming

·	Hoe te Python profiel
·	Niet-numerieke Port Fouten in …
·	Hoe te testen in Python Als ee…
·	Hoe de test uitvoeringstijd In…
·	Hoe een oscilloscoop in Python…
·	Hoe te Words & Lines tellen in…
·	Hoe te SQLite bestanden te lez…
·	Hoe te Grafiek Met Python
·	Timing van een Routine in Pyth…

Related Articles

Hoe maak je een Combo Box Maak in Visual…
Hoe maak je een Check Box Maak in Visual…
Hoe maak je een tekstvak maken in Visual…
Hoe maak je een optie Box in Visual Basi…
Hoe maak je een schijf keuzelijst in Vis…
Hoe kan ik een keuzelijst maken in Visua…
Hoe kan ik een Picture Box Maak in Visua…
Hoe een bestand keuzelijst Maak in Visua…
Hoe kan ik een afbeelding Box Maak in Vi…

Programmering Articles

·	Hoe maak je een Full Pad in VB6 Krijg
·	Hoe Mobile Devices Met behulp van PHP
·	Hoe te compileren in VB
·	Hoe maak je een C + + Vector om gegevens…
·	Hoe maak je een CSS te bouwen met MySQL …
·	Hoe maak je een binair bestand Van Maken…
·	Gebruik van Python Web
·	Hoe maak je een dynamische menu maken do…
·	Hoe om te zien als er een code bestaat i…