Een spraaksynthese server is een computer in het netwerk dat een menselijke gebruiker om invoer via spraak prompts . Deze servers rekenen op vele complexe onderliggende technologieën , zoals tekst - naar-spraak , spraaksynthese en spraakherkenning . Leren over deze technologieën , en hoe ze samenwerken , kunt u een betere waardering voor de complexe innerlijke werking van de spraaksynthese server geven . Speech Synthesis Server Veel callcenters gebruiken spraaksynthese servers om de route van bellers van het hoofdmenu naar een menselijke operator die werkt in een specifieke afdeling . Deze servers zijn meestal geschikt voor het produceren spraak-als het begrijpen ervan . Spraaksynthese servers worden ook gebruikt in webapplicaties om ze toegankelijker en interactiever te maken . Spraaksynthese spraaksynthese accepteert invoer in de vorm van voorgeprogrammeerde tekst of real-time commando en uitgangen herkenbaar toespraak . Spraaksynthese motoren dat proces voorgeprogrammeerde een enkele taak , zoals het informeren van bezoekers die een bepaald gebied is verboden terrein uit te voeren tekst vaak . Spraaksynthese motoren die real -time opdrachten aanvaarden worden gebruikt om gehandicapten te voorzien van een middel om te communiceren , en worden ook gebruikt in telecommunicatiesystemen . De stem die je hoort van deze systemen is een combinatie van de menselijke stem samples en algoritmen die de illusie van gladde spraak te creëren . Spraakherkenning Spraakherkenning systemen in omgekeerde richting . Zij interpreteren speech van een mens en het omzetten in tekst . Stemherkenningssystemen hanteren de uitlegging van spraak een mens die is gebaseerd op waarschijnlijkheden . Bijvoorbeeld , in een eenvoudige spraakherkenningssysteem waarbij de enige aanvaardbare inputs " ja " of "nee ", de computer kan de kans dat een gebruiker zegt een of de ander te berekenen . Dit is mogelijk omdat het spraakherkenningssysteem de fonetische klanken van elke ingang tegen een database van samples kunt vergelijken . Het principe is hetzelfde voor systemen met vele ingangen , al is de kans op fouten groter is . Text - to-Speech Tekst - naar-spraak is een technologie dat mens - herkenbare tekst omzet in zijn fonetische equivalent, dan zet dat in geluid met behulp van luidsprekers . Een groot deel van dit proces houdt zich bezig met het interpreteren van de tekst en af te breken in stukken . Elk stuk kan worden samengesteld uit verschillende woorden , en vertegenwoordigt individuele zinnen . Op deze manier kan de tekst - naar - spraak-engine toespraak dat natuurlijk voor de menselijke luisteraars geluiden maken . Geavanceerde tekst-naar - spraak-engines verdere breken deze eenheden in afzonderlijke lettergrepen , compleet met hoogte en de duur informatie .
|