Hur Skrapa & Parse Adresser

skrapning och tolkning är två närbesläktade webbplats datautvinning praxis . Den mer generella , parsning , hänvisar till att uppgifterna bryts ned i sina beståndsdelar . När mitt - lärare i engelska bad dig diagram meningar , var du tolka orden i dessa meningar för sina ordklasser . Skrapning mer specifikt avser analysera webbsidor för vissa typer av uppgifter , i det här fallet , adresser . Programmeringsspråket Python och den " BeautifulSoup " förlängning tillåter användaren att skrapa och tolka webbplatser i några få rader kod . Saker du behöver
Python 2.6 eller högre
BeautifulSoup 3.2
Visa fler instruktioner
1

Installera BeautifulSoup genom att ladda ner den senaste versionen från crummy mjukvara och packa /packa upp filen. Öppna ett terminalfönster och skriv följande kommando : My - iMac : ~ me $ python Downloads/BeautifulSoup-3.2.0/python setup.py install

Detta berättar Pythontolk att köra skriptet BeautifulSoup installationen som kan hittas i BeautfulSoup mapp , som ligger i mappen Hämtade filer
2

Type python vid prompten , slå tillbaka och import BeautifulSoup : . My - iMac : ~ me $ python >>> import BeautifulSoup Addera 3

Kör följande skript för att öppna en webbsida och skriva några Universal Resource Locator ( webb-adresser ) du kan hitta i en sida : >>> import urllib2 >> ; > sidan = urllib2.urlopen ( " http://www.THE webbadressen som du vill skrapa HÄR " ) >>> soppa = BeautifulSoup ( sida ) >>> soup.findAll ( ' a ' ) >>> print soup.strip ( ) >>> printThis skript kommer att öppna en webbsida , tolka html , söka efter taggen där webbadresser är inbäddade , bort taggarna och lämna text .

Tidigare: Hur får man Python att få en bildvisning

nästa: Hur: Metod för Pylon Target Montage

relaterade artiklar

·	Hur man gör en exe från en Python fil
·	Hur man läser en webbsida använder Python
·	Hur man kompilerar en Dictionary of Numbers i Python
·	Hur man gör en sträng till en webbadress i Django
·	Hur du vet måtten på en Array i Python
·	Hur Beräkna Simpson regel med Python
·	Hur Kopiera en lista med objekt i Python
·	Hur man skapar en if-sats i Python
·	Hur till Aktivera en knapp med wxPython
·	Hur man sparar en Array i Python

Utvalda artiklarna

·	Hur du tar bort element från en Python lista
·	PHP File Upload fel
·	Lägga keyListener till JFrame
·	Hur man lär Pekare i C
·	Hur man gör en Div Pop - up
·	Lägga till en panel till JFrame
·	Hur vill ändra teckensnitt i System.Windows.Textbox
·	Varför pratar Datorer i tal snarare än ord
·	Konvertera ett Vb Project till EXE
·	Hur konverterar jag den datumstämpel datum i DB2