MATLAB is een acroniem voor " matrix laboratorium " en verwijst naar een high-level programmeertaal en programmeeromgeving ontwikkeld door technische software bedrijf MathWorks . OCR is een afkorting voor ' optical character recognition ' en verwijst naar het proces van het lezen van gegevens in gedrukte vorm en het identificeren van optische patronen die overeenkomen met letters, cijfers en andere tekens. OCR Alle p van de stappen die betrokken zijn bij OCR - segmentatie , feature extractie en classificatie - kan worden geïmplementeerd met behulp van MATLAB . Segmentatie , wat inhoudt dat het controleren van de connectiviteit van vormen , en etikettering en ze te isoleren , is de belangrijkste fase omdat het toelaat het OCR-programma om functies te extraheren uit elk individuele karakter . Segmentatie van handgeschreven tekst is bijzonder moeilijk omdat handschrift neiging om met elkaar verbonden . Kenmerkextractie haalt de meest handige functies , in termen van erkenning , van elk personage en classificatie wijst deze functies te character classes . Fotolader Volgens een paper gepresenteerd bij een seminarie gegeven door Lasin Laboratorium Synergetics aan de Universiteit van Ljubljana , kan OCR in MATLAB worden geïmplementeerd met behulp van de Neural Network Toolbox en Image Processing Toolbox add -ons . De eerste fase omvat het lezen van het beeld in de MATLAB werkruimte als een bitmap-bestand . Dit is een type van grafische bestand waarin elk beeldelement of pixel overeenkomt met een of meerdere binair cijfer of bit in het geheugen . De volgende code wordt gebruikt voor deze taak I = imread ( ' training.bmp ' ) ; . Imshow ( I ) Beeldconversiefactor de volgende stap is het gekleurde beeld dat wordt opgeslagen als afzonderlijke rode , groene en blauwe overlays , omzetten in een grijswaardenafbeelding die uit discrete grijstinten . De volgende MATLAB -code converteert de RGB-afbeelding in een afbeelding in grijswaarden iGray = rgb2gray ( I ) ; . Imshow ( iGray ) Dorsen Vervolgens , een techniek die bekend staat als " dorsen " wordt gebruikt voor het omzetten van de afbeelding in grijswaarden in een binair beeld . De cel van MATLAB codes die nodig zijn om het om te zetten in grijswaarden afbeelding in een binair beeld ziet er ongeveer zo uit: IBW = im2bw ( iGray , graythresh ( iGray ) ) ; imshow ( IBW ) < br > Randdetectie Zodra het binair beeld is gemaakt, worden de individuele karakters bijgesneden in subplaatjes . Deze bieden de ruwe gegevens voor de feature- extractie routine . De subplaatjes moet scherp worden bijgesneden aan de grens van elk karakter , als ze te zijn van een standaard grootte , dus het detecteren van de rand van elk teken belangrijk is . De rand van een beeld kan worden gedetecteerd met behulp van de volgende MATLAB code iEDGE = rand ( uint8 ( IBW ) ) op ; . Imshow ( iEDGE ) Objecten . Alle objecten in een beeld - en de eigenschappen van elk object - [ Ilabel num ] = bwlabel ( Ifill ) kan worden bepaald met behulp van de volgende MATLAB -code ; disp (num ) ; Iprops = regionprops ( Ilabel ) ; ibox = [ Iprops.BoundingBox ] ; ibox = hervormen ( ibox , [ 4 50 ] ) ; imshow ( I ) op
|