Optical Character Recognition ( OCR ) is een data -entry techniek die een specifiek lettertype en een OCR -scanner om de tekenset te lezen en stuur het naar uw computer gebruikt . Het American National Standards Institute of ANSI , definieert het lettertype als een reeks tekens 0-9 , A tot en met Z , en een paar speciale karakters , elk met een gedefinieerde grootte en vorm . OCR- fonts reproduceerbaar zijn , en mensen en OCR- scanners kunnen lezen en onderscheiden . Categorieën OCR- scanners zijn ofwel tekstinvoer of Gegevens Capture scanners . Text Input scanners lees het volledige document , of althans grote delen ervan . Gegevensinvoer hand kan worden gevoed of de scanner kan automatisch gegevens voeden , lezen , sorteren en stapelen capaciteiten hebben . Bij gebruik van een Text Input scanner , bewerken vindt plaats tijdens of na het scannen . Datacaptatie scanners afvang en -formaat gegevens tijdens het scanproces , en geen menselijke bewerking van gegevens plaatsvindt . Vanwege dit , moet Gegevensregistratiehardware scanners worden nauwkeuriger . Soorten Scanner types kan stilstaand of hand-held te zijn . Stationaire scanners , zoals flatbed , vellen- en drum scanners gebruiken voornamelijk tekstinvoer te lezen , verwerken en opslaan van afbeeldingen op uw computer , waar u vervolgens kunt bewerken of de genomen foto anders opmaken . Hand-held scanners , zoals digitale pennen of barcode scanners , gebruikt u tekstinvoer of Datacaptatie om de gegevens te lezen en te verwerken en vervolgens opslaan om deze later te bewerken , of " lock " data editing te voorkomen . Methoden Kortom , een OCR- scanner maakt een foto van het document , en vervolgens de OCR- scanner -software kijkt naar de OCR lettertype het beeld bevat , en dan leest en zet het om tekst met behulp van een matrix Matching of Feature Extraction methode . Matrix Matching is een vorm van patroonherkenning wanneer de scanner kijkt een karakter en deze vergelijkt een in de bibliotheek van tekens of tekensjablonen . Feature Extraction is niet afhankelijk van een vooraf bepaalde bibliotheek , maar algemene kenmerken zoals open gebieden , gesloten vormen en snijdende lijnen als ontcijferen tekens . Feature Extraction gaat ook door de naam Intelligent Character Recognition , of ICR . Voordelen Het belangrijkste voordeel van het gebruik van een OCR -scanner is de eliminatie van menselijke invoerfouten . OCR- scanners gelezen gegevens in snelheden die kunnen oplopen tot meer dan 200 tekens per seconde . De nauwkeurigheid van een OCR- scanner 99,9975 procent of een teken leesfout in 40.000 , in vergelijking met een menselijke leesfout snelheid van een in 300 tekens . Automatische check digit validatie kan de OCR- nauwkeurigheid te brengen tot minder dan een op 3.000.000 . Overwegingen originelen van slechte kwaliteit zal resulteren in minder nauwkeurige OCR documenten . Handgeschreven documenten , documenten met opgemaakte tekst , oudere documenten , fotokopieën en meest gefaxte documenten niet goed werken met OCR- scanners . Aanbevelingen voor aanvaardbare documenten bevatten gedrukte tekst in een lettergrootte van minder dan 72 punten , laser-en inkjet tekst printer, fax -documenten met 200 dots per inch ( dpi ) of grotere resolutie en commercieel drukwerk zoals boeken , brochures en tijdschriften. < br >
|