? En spindel är ett program som loggar länkar mellan webbsidor . Spindlar kan skrivas i något programmeringsspråk , inklusive PHP . Du kan få en spindel program skrivet i PHP antingen genom att ladda ner en, eller skriva en. Ett antal spindel funktion biblioteken är tillgängliga för PHP . PHP
PHP är ett programmeringsspråk skriven för att skapa dynamiska webbsidor . En dynamisk webbsida är en vars innehåll ändras beroende på användarens åtgärder eller ringa parametrar . Webbsidor är skrivna i Hypertext Markup Language , eller HTML . HTML är en formatering system, men inte ett programmeringsspråk . Webbsidor lagras och levereras i sitt ursprungliga skick. Denna form av fil kallas en statisk webbsida . Webbsidor som skapats av PHP ske i form av en HTML-mall med programmeringskod in i brödtexten i dokumentet . När programmet kallas , är dessa programmering block exekveras , ersätter sig med HTML . En spindel kallas också en sökrobot eller en Web Bot Addera Spider
. Syftet med denna kategori av program är att dokumentera webbsidor på World Wide Web. Programmet behöver en webbsida som utgångspunkt . Det kallas ett " frö . " Det följer sedan en länk på den sidan till en annan sida och sedan följer en länk på den sidan till en annan sida och så vidare . Spindeln kan skrivas för att logga information om varje sida den besöker , eller bara konstatera dess existens . Sökrobotar kopierar varje sida stött in i sökmotorns databas där andra program utför ytterligare analys . Även många spider implementeringar har en rad uppgifter , är handlingen att gå från en sida till en annan uppgift som definierar programmet som en spindel .
Programmering Spindlar
Även en spindel kan skrivas i valfritt språk , Java , Perl och C är # de mest populära språken för dessa program . Detta beror främst på att programmerare är specialiserade inom webbprogrammering är bekant med dessa språk . Python och PHP används också , återigen , eftersom dessa språk har en resurspool följer bland webbvärlden .
Metod
PHP vanligen används för att generera webbsidor som presenteras sedan till att begära webbläsare . Webbläsare har aktiv roll för att söka en webbplats och begär en sida från webbservern . PHP : s roll är oftast statisk . Ett PHP -program som fungerar som en spindel har att efterlikna webbläsare genom att begära webbsidor från webbservrar . Webbsidor transporteras av Hypertext Transfer Protocol . Detta betyder inte hämta en fil som innehåller sidan , men kopierar ut koden för sidan och bär det i kroppen av meddelandet svarar på en begäran om en sida . PHP Spider har att läsa in innehållet i meddelandet . Det sparar inte på sidan, men skannar inkommande text för webblänkar . Länken kan vara i vilket format som helst , eftersom HTML lagrar länkar med en etikett som " " så att programmet bara har att leta efter de symboler och kopiera ut texten , där " .. . " visas i det här exemplet . Söka igenom text och strippning ut särskilda avsnitt heter " parsing " i programmering språkbruk .