programmeringsspråket Python använder reguljära uttryck för mönstermatchning . Programmerare använder ofta reguljära uttryck för att söka text efter mönster av bokstäver, symboler och siffror . Kraften i reguljära uttryck kommer från det faktum att de inte används för att söka efter något specifikt , liksom ordet "hund" , utan de söker efter ord som matchar ett visst mönster , såsom e- domännamn . Till exempel kan du använda Python att byta domännamn på en lista över e-postadresser som använder reguljära uttryck . Saker du behöver
dator med programmeringsspråket Python installerat
Visa fler instruktioner
1
Öppna IDLE textredigerare som levereras med Python-språket genom att klicka på dess ikon . Den IDLE textredigerare ikonen finns i Python katalog i listan Installerade program ( finns under Alla program i Windows Start-meny och i programmappen i OSX ) . En tom källkod fil öppnas i redigerarens huvudfönster
2
Inkludera ' re' modul genom att skriva denna rad längst upp källkoden filen : .
Import re
3
Deklarera en sträng och tilldela vissa e-postadresser till den , som den här:
emailAddresses = ' William@amail.com , John@bmail.com , Bruce @ cmail.com "
4
Skapa ett reguljärt uttryck som söker efter alla möjliga text permutationer i giltiga e-postadresser . Reguljära uttryck fungerar genom att söka efter ett mönster av tecken i en textsträng . Mönstret du är intresserad av är två ord förbundna med ett @-tecken . Eftersom e-postadresser har många giltiga tecken , vill du matcha alla tänkbara tecken i varje ord före och efter @ -symbolen. Detta åstadkoms med det reguljära uttrycket [ \\ w \\ - . ] , Och genom att lägga till ett + i slutet av det , kan du upprepa detta för alla tecken . Den färdiga reguljära uttryck kan sparas till en sträng som denna :
regexPattern = r ' ( [ . \\ W \\ - ] + ) @ ( [ . \\ W \\ - ] + ) '
5
Skapa ett reguljärt uttryck som ersätter alla domännamn med " zmail.com . " I detta reguljära uttryck , \\ 1 den bakåtreferens teckensekvensen används för att ersätta domänen för e-postadresser . Den bakåtreferens refererar till en plats i ett reguljärt uttryck omgivet av parenteser . Genom att tillämpa det reguljära uttrycket för den första bakåtreferens sparar du den e-postadress men kasta det gamla domännamnet . Du kan sedan lägga till ett nytt domännamn , som " @ zmail.com . " För att spara denna andra reguljära uttryck till en variabel , kan du skriva det här :
regexReplacement = r ' \\ 1@zmail.com "
6
Tillämpa reguljära uttryck till den sträng som innehåller de e-postadresser som denna :
emailAddresses = re.sub ( regexPattern , regexReplacement , emailAddresses )
7
Skriv ut e-postadresser med denna kodrad . Python 3 använder denna syntax för utskrift : print ( emailAddresses ) , medan Python 2 använder denna syntax : print emailAddresses
8
Kör programmet genom att trycka på F5 -tangenten . . Programmet utgång är :
William@zmail.com , John@zmail.com , Bruce@zmail.com