Tesseract Optisk teckenigenkänning bibliotek erbjuder utvecklare ett sätt att skanna dokument och text till en bild . Du använder Tesseract biblioteken för att lagra bilder av dokument som du inte längre behöver i pappersform . Du använder Tesseract bibliotek i Java genom att loopa igenom varje tecken och skriva tecknet till en fil . För att använda biblioteken , måste du inkludera Java namnrymden för OCR -funktioner . Instruktioner
1
Högerklicka på Java -filen som du vill använda för att skapa OCR dokumentet . Klicka på " Öppna med " och välj önskad Java editor .
2
Lägg OCR biblioteket namespace längst upp i filen . Kopiera och klistra in följande kod till din källkod fil :
com.tplan.robot.imagecomparison.tesseractocr
3
Skapa den kod som skannar tecken i filen . Till exempel , följande kod loopar igenom varje tecken i en fil och skriver den till en bildfil :
Var linjer = 0Compareto method = " tocr " cmparea = " x : 33 , y : 2 , w : 200 , h: 22 " för ( i = 1; { i} < { linjer } 1 , i = { i} +1 ) { Typeline " { _TOCR_LINE { i} } " }
4
Klicka Java redaktörens " Spara " -knappen och klicka på " Kör " för att köra koden i en Java debugger .