De mogelijkheid om een document te scannen en in machine - leesbare vorm is een weergaloos time saver . In plaats opnieuw invoeren van het document , en eventueel invoegen onjuiste eigen , scannen en langs de gescande beeld door een software lezer kan resulteren in een bewerkbare document met een grote nauwkeurigheid in vergelijking met de oorspronkelijke . Deze software proces heet optische tekenherkenning . Optical Character Recognition Optical character recognition ( OCR ) is een proces waarbij gedrukte of handgeschreven tekst wordt mechanisch of elektronisch gelezen en omgezet in een vorm herkend door een computer . Het geavanceerd proces beschouwt de lettervormen en vergelijkt ze met een bibliotheek van gelijkaardige vormen . Wanneer een overeenkomst is gevonden, wordt een teken vertegenwoordigt het patroon op het scherm of in een computerbestand ingevoerd. OCR maakt het mogelijk om een document te scannen en te lezen door een computer , het creëren van een bestand dat kan worden bewerkt of gehandeld op andere manieren. OCR Software computer software wordt gebruikt voor moderne implementatie OCR . De software is uitgebreid vanaf het allereerste begin waarin het programma moest worden gekalibreerd voor elke unieke font werd verwacht te herkennen . Het is beschikbaar in de standalone- vorm als een programma speciaal gemaakt voor de taak , en als een component in scansoftware . De komst van het internet en cloud computing heeft geleid tot de ontwikkeling van web - based OCR- programma's , waardoor de noodzaak voor individuele desktop of server installaties . De erkenningsprocedure < br > OCR-software werkt door eerst de erkenning van het onderscheid tussen lichte en donkere gebieden van de gescande afbeelding . Als hij ontdekt een licht-donker onderscheid zal de software zoekt naar herkenbare patronen , zoals verticale en horizontale lijnen , en verbonden of gedeeltelijk bochten . Als het een patroon als een brief of een ander karakter kunnen herkennen , zoekt het zijn database voor de overeenkomstige karakter in taal set van de computer . Vervolgens gaat dit karakter op het beeldscherm het document of assembleert . Als de software niet in staat is om een teken te herkennen , kan het zijn best guess maken of te vervangen een andere teken om het proces te gaan . Mogelijke problemen met OCR -software Sinds OCR-software is gebaseerd op patroonherkenning , elke artefact op de pagina die mogelijk van invloed kunnen dit proces is een bron van problemen . OCR werkt het beste wanneer er een duidelijk onderscheid tussen de tekens en de achtergrond van het document , idealiter zwart op wit . Gekleurd of drukke achtergronden die de patronen minder onderscheidend kan problemen veroorzaken . Vlekken, kreukels en andere schade aan het document kan leiden tot onjuiste tekenherkenning ook.
|