Text parsning verktyg finns för systemadministratörer och webbdesigners som behöver söka stora mängder text att bestämma struktur och organisation av datorn, systemet skript eller pålägg dokument . Snabb och smutsiga SED och Perl -skript byggda kring reguljära uttryck är tillräckligt ofta för enkla jobb , men tolka komplexa XML-dokument kräver ett mer kraftfullt verktyg , såsom programmeringsspråket Python s elementtree bibliotek . Saker du behöver
Python 2.5 eller högre
Visa fler instruktioner
1
Initiera en terminal session eller , om du föredrar , öppnar Python Integrated Development Environment , kallas IDLE , som kan hittas i Python katalogen i din C-enhet ( Windows ) eller mappen Program ( Mac ) . Kontrollera din version av Python genom att skriva python - v vid kommandoraden . Elementtree är en del av Python standardbibliotek som i Python 2.5 . Om du har Python 2.4 eller tidigare , måste du ladda ner det från den huvudsakliga Python sidan .
2
Bestäm vilken typ av data som kodas i ett XML-dokument genom att läsa roten taggen . På kommandoraden , last elementtree och dess parse funktion med följande kommando :
> från elementtree.ElementTree import parse
3
Leta reda på filen du vill tolka och anteckna sin bana i förhållande till det av Pythontolk , eller helt enkelt flytta filen till mappen Dokument . Ställ en variabel för filen , läsa in den i minnet och upptäcka den typ av data filen innehåller med följande kommando : > tree = elementtree ( file = filename ) > elem = tree.getroot ( ) > Print elem
Detta kommer att avslöja vilken typ av data som är kodade i XML- dokumentet .