Opsporen naamwoorden in Python vraagt om de vaardigheden van een programmeur en een linguïst . De Engels taal zelf legt vallen voor de onverschrokken computerlinguïst met zijn rijke morfologische dubbelzinnigheid . Zo zou het woord " kruisen " van een meervoudig zelfstandig naamwoord of een derde - persoon tegenwoordige tijd werkwoord zijn. Gelukkig hebben de makers van de Natural Language Toolkit Python module een part- of-speech tagger die goed is voor deze problemen ontwikkeld en kunnen de woorden van Engels zinnen taggen met hun respectievelijke delen van meningsuiting , met inbegrip van zelfstandige naamwoorden . Wat je nodig hebt Python 2.4 , 2.5 of 2.6 of Natural Language Toolkit Python module Toon Meer Aanwijzingen 1 Download en installeer de Python module Natural Language Toolkit van de ntlk.org project website . U kan nodig zijn om extra modules te installeren om NLTK ondersteunen . Kopen van 2 Open een terminalvenster en beginnen een Python sessie door te typen Python op de commandoregel prompt . Wanneer Python is up and running , roepen de NLTK module met het commando import NLTK . De aanwijzingen en opdrachten zo uitzien op Mac OS X : My - MacBook - Pro : ~ PNA1 $ python Python 2.6.1 ( R261 : 67515 , 24 juni 2010 , 21:47 : 49 ) op [ GCC 4.2.1 ( Apple Inc build 5646 ) ] op darwin Type " helpen " , " copyright " , "credits " of " licentie" voor meer informatie . >>> import nltk >>> 3 Roep het deel van meningsuiting tagger en voer de zin in die u wilt naamwoorden te detecteren door het volgende te typen commando's en data op de Python prompt : >>> tekst = nltk.word_tokenize ( " de man steekt de straat te kruisen te verkopen . " ) < br > >>> nltk.pos_tag ( tekst ) op Twitter Druk 4 de return toets na >>> nltk.pos_tag ( tekst ) op [ ,"( ' het ' , ' DT ' ) , ( ' man ' , ' NN ' ) , ( ' kruisen ' , ' VBZ ' ) , ( 'de' , ' DT ' ) , ( 'straat' , ' NN ' ) , ( ' aan ' , ' TO ' ) , ( 'verkopen' , ' VB ' ) , ( ' kruisen ' , ' NNS ' ) , ( ' . ' , ' . ' ) ] >> > NLTK correct gelabeld elk woord in de zin . In het bijzonder heeft zij de zelfstandige naamwoorden gedetecteerd en gelabeld ze als enkelvoudige zelfstandige naamwoorden met NN ( man , straat) en meervoud met NNS ( kruisjes ) en heeft het eerste exemplaar van kruisingen correct gemarkeerd als een werkwoord met de tag VBZ . < br >
|