Sintesi vocale (Text-to-Speech)
In breve
La sintesi vocale (TTS, text-to-speech) trasforma il testo scritto in parlato. È così che un assistente telefonico IA ottiene una voce naturale per pronunciare ad alta voce la risposta generata.
Dal testo alla voce
Un sistema TTS analizza il testo, definisce intonazione, pause e altezza, e ne produce un segnale audio. I modelli neurali moderni suonano fluidi e naturali, lontani dalla voce robotica dei primi sistemi.
Perché conta nelle telefonate
La voce determina come viene percepita una chiamata. Una voce TTS calda e chiara, con intonazione naturale, fa sentire chi chiama preso sul serio e ben disposto a continuare.
Domande frequenti
No, è l'opposto. La TTS trasforma il testo in parlato (text-to-speech); il riconoscimento vocale trasforma il parlato in testo (speech-to-text).
La sintesi vocale neurale moderna suona naturale, con intonazione e pause. Molti non si accorgono che la voce è sintetica.
Termini correlati
Approfondisci con questi argomenti correlati sulla telefonia IA.

