? En talsyntes server är en nätverksansluten dator som uppmanar en mänsklig användare för inmatning med tal . Dessa servrar är beroende av många komplexa bakomliggande teknik, såsom text - till - tal- , röst- syntes och röstigenkänning . Lär dig mer om dessa tekniker , och hur de fungerar tillsammans , kan ge dig en bättre förståelse för de komplexa inre arbetet i talsyntes servern . Talsyntes Server
Många callcenter använder servrar talsyntes för att dirigera samtal från huvudmenyn till en mänsklig operatör som arbetar i en särskild avdelning . Dessa servrar är vanligtvis kan producera tal samt att förstå det . Talsyntes servrar används också i webbapplikationer för att göra dem mer tillgängliga och interaktiva .
Speech Synthesis Engine
En talsyntes motorn accepterar indata i form av förprogrammerade text eller realtid kommandon och utgångar igenkännbar tal . Talsyntes motorer som bearbetar förprogrammerade text ofta utföra en uppgift , som informerar besökare om att ett visst område är tabu . Talsyntes motorer som accepterar realtid kommandon används för att tillhandahålla de handikappade med ett sätt att kommunicera , och används också i telekommunikationssystem. Rösten som du hör från dessa system är en kombination av mänskliga röstprover och algoritmer som skapar illusionen av släta tal .
Röstigenkänning
Röstigenkänning system fungerar i motsatt riktning . De tolka en människas tal , och konvertera det till text . Röstigenkänningssystem använder en metod för att tolka en människas tal som är baserat på sannolikheter. Till exempel, i ett enkelt röstigenkänningssystem där de enda acceptabla ingångarna är "ja" eller " nej", om datorn är i stånd att beräkna sannolikheten att en användare säger ena eller det andra . Detta är möjligt eftersom röstigenkänningssystem kan jämföra de fonetiska ljud av varje ingång med en databas med prover. Principen är densamma för system med många ingångar , men sannolikheten för fel är större .
Text -to - Speech
Text - till - tal är en teknik som omvandlar mänskligt igenkännbar text i sin fonetiska motsvarighet , sedan omvandlar det till ljud med hjälp av högtalare . En stor del av denna process handlar om att tolka texten och bryta ner den i bitar . Varje del kan bestå av flera ord , och representerar enskilda fraser . På detta sätt kan text-till- tal-motor återge tal som låter naturligt att mänskliga lyssnare . Sofistikerade text - till - tal motorer bryta ytterligare dessa enheter i enskilda stavelser , komplett med tonhöjd och duration information.