? Möjligheten att skanna ett dokument i maskinläsbar form är en makalös tidsbesparing . Hellre än att skriva om dokumentet , och eventuellt sätta fel i ditt eget , skanna den och passerar den skannade bilden via en programvara läsare kan resultera i ett redigerbart dokument med en hög grad av noggrannhet i jämförelse med originalet . Denna programvara process kallas optisk teckenigenkänning . Optical Character Recognition
optisk teckenigenkänning ( OCR ) är en process där tryckt eller handskriven text är mekaniskt eller elektroniskt läsa och omvandlas till en form som godkänts av en dator . Den sofistikerade process ser bokstaven former och jämför dem med ett bibliotek av liknande former. När en matchning görs , är ett tecken som representerar det mönster som visas på skärmen , eller in i en datafil . OCR gör det möjligt för ett dokument som ska skannas och läsas av en dator , skapa en fil som kan redigeras eller åtgärdas på annat sätt . Addera OCR Software
dataprogram används för moderna OCR genomförande . Programvaran har utvecklats från dess tidigaste dagar , där programmen måste kalibreras för varje unik typsnitt det förväntades att erkänna . Den finns i fristående form som en program som skapats specifikt för uppgiften , och som en komponent i scanning programvara . Tillkomsten av Internet och cloud computing har lett till utveckling av webbaserade OCR-program , vilket eliminerar behovet av enskilda desktop eller server installationer .
Igenkänningsprocessen
OCR-program fungerar genom att först erkänna skillnaden mellan ljusa och mörka områden i den skannade bilden . Som den upptäcker en ljust - mörkt skillnad , ser programmet för igenkännbara mönster, såsom vertikala och horisontella linjer , samt anslutna eller partiell kurvor . Om den kan känna igen ett mönster som ett brev eller annan karaktär , söker den sin databas för motsvarande tecken i datorns språk set . Den passerar sedan detta tecken på att det dokument eller fönster det montering . Om programmet inte kan känna igen en karaktär , kan det göra sitt bästa gissning eller ersätta en alternativ karaktär för att hålla processen igång .
Potentiella problem med OCR-programvara
Eftersom OCR-programvara bygger på mönsterigenkänning , är någon artefakt på sidan som skulle kunna påverka denna process en källa till problem . OCR fungerar bäst när det finns en klar skillnad mellan tecknen och bakgrunden på dokumentet , helst svart på vitt . Färgade eller upptagen bakgrunder som gör mönstren lägre särskiljningsförmåga kan orsaka problem . Fläckar , veck och andra skador på dokumentet kan resultera i felaktiga teckenigenkänning samt.