U beschrijft optische karakterherkenning (OCR) .
OCR is een technologie waarmee computers tekst uit afbeeldingen kunnen "lezen" en deze kunnen omzetten in machinele leesbare tekst. Dit betekent dat de computer de tekst vervolgens kan begrijpen, bewerken, zoeken en manipuleren, net zoals deze kan met tekst die direct in een computer is getypt.
Hier is een uitsplitsing van hoe het werkt:
* Afbeelding vastleggen: Een afbeelding van het document wordt gemaakt, hetzij door een scanner of een camera.
* voorbewerking: De afbeelding wordt opgeruimd door ruis te verwijderen, vervormingen te corrigeren en de tekst in individuele tekens te segmenteren.
* Karakterherkenning: De afzonderlijke tekens worden geanalyseerd en vergeleken met een database met bekende tekens om ze te identificeren.
* tekstuitvoer: De herkende tekst wordt uitgevoerd in een digitaal formaat, zoals platte tekst of een tekstverwerkingsdocument.
Toepassingen van OCR:
* Documentdigitalisering: Papierdocumenten omzetten in doorzoekbare elektronische bestanden.
* data -extractie: Gegevens extraheren uit formulieren, facturen en andere documenten voor analyse.
* Geautomatiseerde vormverwerking: Formulieren automatisch invullen door handgeschreven of afgedrukte gegevens te herkennen.
* vertaalsoftware: Tekst vertalen in afbeeldingen.
* Toegankelijkheid: Tekst maken in afbeeldingen die toegankelijk zijn voor mensen met een visuele beperking.
Laat het me weten als je nog andere vragen hebt! |