Upptäcka substantiv i Python efterlyser kompetensen hos en programmerare och en lingvist . Det engelska språket självt lägger fällor för den vane Datalingvist med dess rika morfologiska tvetydighet . Till exempel kan ordet " korsen " vara ett substantiv i plural eller en tredje person närvarande - spända verb . Lyckligtvis har skaparna av Natural Language Toolkit Pythonmodul utvecklat en del - av - tal taggaren som står för dessa svårigheter och kan märka ord engelska meningar med sina respektive ordklasser , inklusive substantiv . Saker du behöver
Python 2.4 , 2.5 , eller 2.6
Natural Language Toolkit Pythonmodul
Visa fler instruktioner
1
Hämta och installera Python -modulen Natural Language Toolkit från ntlk.org projektets webbplats . Du kan behöva installera ytterligare moduler för att stödja nltk .
2
Öppna ett terminalfönster och börja en Python session genom att skriva Python på kommandoraden . När Python är igång , åberopa nltk modulen med kommandot import nltk . Anvisningarna och kommandon ser ut så här på Mac OS X :
My - MacBook - Pro : ~ pna1 $ python
Python 2.6.1 ( R261 : 67515 , 24 juni 2010 , 21:47 : 49 ) katalog
[ GCC 4.2.1 ( Apple Inc. build 5646 ) ] på darwin
Type " hjälpa " , " copyright " , " credits " eller " licens " för mer information .
>>> import nltk
>>>
3
Åkalla ordklass tagger och skriv meningen i som du vill upptäcka substantiv genom att skriva följande kommandon och data på Python -prompten :
>>> text = nltk.word_tokenize ( " mannen korsar gatan för att sälja kors . " )
>>> nltk.pos_tag ( text )
4
Tryck på Enter efter >>> nltk.pos_tag ( text ) katalog
[ ,"( " den" , " DT " ) , ( "man" , " NN ' ) , ( ' kors ' , ' VBZ ' ) , ( ' den ' , ' DT ' ) , ( ' street ' , ' NN ' ) , ( ' till ' , ' TO ' ) , ( ' sälja ' , ' VB ' ) , ( ' kors ' , ' NNS ' ) , ( ' . ' , ' . ' ) ]
>> >
nltk har rätt taggade varje ord i meningen . I synnerhet har det upptäckts substantiv och taggat dem så singular substantiv med NN ( mannen , gata ) och substantiv plural med NNS ( kors ) och har korrekt markerade den första förekomsten av kors som ett verb med taggen VBZ .
Addera