ChatGPT é um modelo de linguagem poderoso, capaz de gerar textos notavelmente semelhantes aos humanos.
No entanto, quando essas respostas são lidas em voz alta usando conversão de texto em fala (TTS), elas às vezes podem ter uma qualidade artificial ou robótica.
Se você deseja uma produção falada surpreendentemente natural, é hora de adicionar um pouco de tempero à mistura! Vejamos técnicas para obter aquela sensação de fala autêntica.
Como melhorar sua saída do ChatGPT
Nas conversas cotidianas, as pessoas raramente falam frases perfeitamente formadas e gramaticalmente corretas. Usamos palavras de preenchimento como “um”, “uh”, “gosto” e “você sabe”. Isso pode parecer confusão verbal, mas na verdade desempenha uma função importante na fala natural.
Você pode instruir o recurso de voz do ChatGPT para incluir esses preenchimentos em suas respostas estrategicamente. Isso ajudará a soar mais coloquial.
Aqui está um exemplo:
- Incitar: Explique a diferença entre tempo e clima.
- Prompt ajustado: Você poderia explicar, hum, a diferença entre tempo e clima? Talvez use alguns ‘curtir’ e ‘você sabe’ também.
Os sistemas TTS converterão essas palavras de preenchimento em pausas e hesitações, tornando o resultado mais orgânico. Experimente encontrar o nível certo para o estilo desejado!
Aqui está a resposta original:
E aqui está a resposta com nosso prompt ajustado:
Além disso, as pessoas usam naturalmente as contrações na fala do dia a dia. “Não posso” torna-se “não posso”, “é” torna-se “é” e assim por diante. Isso faz com que a fala flua mais suavemente e pareça coloquial. Você pode encorajar o ChatGPT a usar contrações para adicionar ao seu padrão de fala “semelhante ao humano”.
A fala humana real tem variação de tom. Usamos mudanças de tom, volume e velocidade para enfatizar palavras ou adicionar emoção. É aqui que alguma pontuação direcionada pode orientar seu TTS:
- Adicionando vírgulas para pausas: “O tempo hoje está ensolarado, quente e perfeito para uma caminhada.”
- Pontos de exclamação para excitação: “Esse filme foi incrível! Adorei o final.”
- Pontos de interrogação transmitem curiosidade: “Sempre me perguntei: como os pássaros aprendem a voar?”
A prática faz progresso
Como qualquer habilidade, tornar a saída falada do ChatGPT mais natural requer prática. Experimente diferentes combinações de técnicas. Preste atenção aos seus podcasts ou audiolivros favoritos para ver como os palestrantes profissionais usam inflexões vocais e palavras de preenchimento com ótimo efeito.
Lembre-se de que não existe uma maneira “certa” de fazer isso!
Uma nota sobre sistemas de conversão de texto em fala
A qualidade do seu sistema TTS também desempenha um papel importante. Alguns são melhores na interpretação da pontuação para uma pronúncia realista do que outros.
As opções populares incluem:
Quando menos pode ser mais?
Embora a saída ChatGPT com som natural seja excelente em muitos casos, há momentos em que uma entrega mais formal ou “robótica” é apropriada. Pense nestes cenários:
- Entrega de notícias ou informações factuais: Concisão e clareza são importantes aqui.
- Acessibilidade: alguns usuários podem achar muitos preenchimentos ou alterações de tons confusos.
É tudo uma questão de encontrar o melhor ajuste para o resultado desejado!
Crédito da imagem em destaque: Jason Leung/Remover respingo