Dator
 |  Startsida |  Hårdvara |  Nätverk |  Programmering |  Programvara |  Felsökning |  System |   
Programmering
  • C /C + + -programmering
  • Computer Programspråk
  • Delphi Programmering
  • Java Programming
  • JavaScript programmering
  • PHP /MySQL Programmering
  • perl Programmering
  • python Programming
  • Ruby programmering
  • Visual Basics Programmering
  • * Dator Kunskap >> Programmering >> python Programming >> Content

    Hur Skrapa & Parse Adresser

    skrapning och tolkning är två närbesläktade webbplats datautvinning praxis . Den mer generella , parsning , hänvisar till att uppgifterna bryts ned i sina beståndsdelar . När mitt - lärare i engelska bad dig diagram meningar , var du tolka orden i dessa meningar för sina ordklasser . Skrapning mer specifikt avser analysera webbsidor för vissa typer av uppgifter , i det här fallet , adresser . Programmeringsspråket Python och den " BeautifulSoup " förlängning tillåter användaren att skrapa och tolka webbplatser i några få rader kod . Saker du behöver
    Python 2.6 eller högre
    BeautifulSoup 3.2
    Visa fler instruktioner
    1

    Installera BeautifulSoup genom att ladda ner den senaste versionen från crummy mjukvara och packa /packa upp filen. Öppna ett terminalfönster och skriv följande kommando : My - iMac : ~ me $ python Downloads/BeautifulSoup-3.2.0/python setup.py install

    Detta berättar Pythontolk att köra skriptet BeautifulSoup installationen som kan hittas i BeautfulSoup mapp , som ligger i mappen Hämtade filer
    2

    Type python vid prompten , slå tillbaka och import BeautifulSoup : . My - iMac : ~ me $ python >>> import BeautifulSoup Addera 3

    Kör följande skript för att öppna en webbsida och skriva några Universal Resource Locator ( webb-adresser ) du kan hitta i en sida : >>> import urllib2 >> ; > sidan = urllib2.urlopen ( " http://www.THE webbadressen som du vill skrapa HÄR " ) >>> soppa = BeautifulSoup ( sida ) >>> soup.findAll ( ' a ' ) >>> print soup.strip ( ) >>> printThis skript kommer att öppna en webbsida , tolka html , söka efter taggen där webbadresser är inbäddade , bort taggarna och lämna text .

    Tidigare:

    nästa:
    relaterade artiklar
    ·Hur man gör en exe från en Python fil
    ·Hur man läser en webbsida använder Python
    ·Hur man kompilerar en Dictionary of Numbers i Python
    ·Hur man gör en sträng till en webbadress i Django
    ·Hur du vet måtten på en Array i Python
    ·Hur Beräkna Simpson regel med Python
    ·Hur Kopiera en lista med objekt i Python
    ·Hur man skapar en if-sats i Python
    ·Hur till Aktivera en knapp med wxPython
    ·Hur man sparar en Array i Python
    Utvalda artiklarna
    ·Hur du tar bort element från en Python lista
    ·PHP File Upload fel
    ·Lägga keyListener till JFrame
    ·Hur man lär Pekare i C
    ·Hur man gör en Div Pop - up
    ·Lägga till en panel till JFrame
    ·Hur vill ändra teckensnitt i System.Windows.Textbox
    ·Varför pratar Datorer i tal snarare än ord
    ·Konvertera ett Vb Project till EXE
    ·Hur konverterar jag den datumstämpel datum i DB2
    Copyright © Dator Kunskap http://www.dator.xyz