Texto para fala (TTS) é uma forma de síntese de fala que converte texto em uma página, como um arquivo de ajuda ou página da web, em saída de voz falada. O TTS pode ser usado para coisas como ler uma mensagem de texto para alguém que está dirigindo ou ler as informações da tela do computador para uma pessoa com deficiência visual. Ele pode pegar qualquer mensagem de texto e transformá-la em uma mensagem verbal de fácil compreensão. Embora o TTS possa não ter a expressão emocional que uma voz humana produz naturalmente, a síntese da fala é normalmente muito precisa. Os sistemas TTS podem ser usados por:
- Alunos com dislexia
- Leitores em movimento
- Multitarefas, como um padeiro, que quer que a receita seja lida em voz alta
- Leitores idosos
- Leitores visualmente inspirados
- Estudantes de língua estrangeira
TTS vs. sistemas de resposta de voz
O TTS não deve ser confundido com os sistemas de resposta de voz (VRS). Um sistema de resposta de voz, também conhecido como resposta de voz interativa, sintetiza a fala concatenando frases de um banco de dados de palavras pré-gravadas e é usado para uma finalidade diferente de um sistema TTS, que forma sentenças e / ou frases com base nos grafemas e fonemas de um idioma.
Os sistemas de resposta de voz são limitados a sintetizar frases que contêm apenas palavras que foram predeterminadas pelo sistema. Os sistemas TTS, em contraste, são teoricamente capazes de “ler” qualquer seqüência de caracteres de texto para formar sentenças originais.
Simplificando, um VRS é uma voz gravada que toca quando um chamador liga. Parece uma voz humana, e essa voz dá opções ao chamador, como pressionar um determinado número no teclado do telefone para que uma determinada ação aconteça . Por exemplo, um VRS pode dizer: “Se você gostaria de falar com o departamento de cobrança, pressione dois.” Depois que dois são pressionados, ele aciona a ação de transferência da chamada para o departamento de cobrança.
No entanto, o VRS não existiria se não fosse pelos sistemas TTS. A TTS é responsável por dar voz a todo o texto escrito por um serviço VRS. Para as empresas, ter um sistema TTS e VRS é benéfico. Ter um sistema TTS permite que uma empresa alcance um novo grupo demográfico da sociedade que inclui aqueles que são deficientes visuais ou têm dificuldade para ler. A chamada pode ser pré-gravada em qualquer idioma, o que significa que as barreiras linguísticas foram removidas. Com a combinação de um sistema TTS e um VRS, uma empresa pode enviar mensagens em formato de áudio e texto para os clientes, permitindo melhor conectividade e comunicação mais rápida.