The VB.NET språket innehåller en HTML parsing klass du använder för att extrahera HTML värden från webbsidor . Använd de analyserade data för att bedöma innehållet på en webbplats och skicka tillbaka information till användaren eller spara den extraherade informationen till en databas . HTML parsing klassen kan du läsa textinnehåll eller några värden i formelement såsom textrutor eller listrutorna . Instruktioner
1
Öppna Visual Studio i " Microsoft . NET Framework " programgruppen . Öppna din VB projekt efter Visual Studio laster .
2
Högerklicka på projektets namn i " Solution Explorer " -panelen och välj " Egenskaper . " Klicka på " . NET " fliken , dubbelklicka sedan på DLL fil som heter " Microsoft.mshtml . " Denna DLL innehåller klasser för att tolka HTML .
3
Lägg biblioteket till VB-kod fil du vill använda att tolka HTML . Kopiera och klistra in följande VB uttalande till toppen av din kod fil :
Imports MSHTML
4
instansiera " HTMLDocument " klass . Denna klass importerar HTML- text som du importerat från en webbsida eller snöre och sätter upp den informationen för att analysera . Lägg till följande kod i din tolkning funktion :
Dim parseHTML Som IHTMLDocument2 = Ny HTMLDocumentClass ( ) Dim htmlData Som IHTMLElementCollection = parseHTML.body.all
5
hämta innehåll från HTML sträng . Till exempel hämtar följande kod värdet från en HTML textruta på en webbsida :
Dim tbData Som IHTMLInputElement = allElements.item ( " TextBox1 " ) MsgBox " Detta är data i textrutan : " & tbData.Value