Sobre a API:
Nossa API de Texto para Fala é uma ferramenta poderosa que permite converter texto escrito em palavras faladas. A API suporta múltiplos idiomas e pode ser integrada a qualquer aplicativo para síntese de fala, assistentes de voz e acessibilidade.
A API utiliza algoritmos avançados de processamento de linguagem natural para analisar o texto de entrada e gerar a saída de fala correspondente com uma voz que soa natural. A saída pode ser personalizada com diferentes vozes, idiomas e taxas de fala. Isso a torna uma ferramenta ideal para uma variedade de casos de uso, como síntese de fala, assistentes de voz e acessibilidade.
A API pode ser integrada a qualquer aplicativo para fornecer feedback falado, como ler texto em voz alta, para usuários com deficiências visuais, ou gerar uma versão em áudio de conteúdo escrito, como livros, artigos e mais. Também pode ser usada para criar assistentes de voz e chatbots, que podem interagir com os usuários por meio da fala.
Além disso, a API pode ser usada em outras aplicações, como sistemas de telefonia, dispositivos de navegação e outros sistemas onde a síntese de fala é necessária. Também pode ser usada para gerar clipes de áudio de qualquer texto, útil para podcasts, apresentações em vídeo e mais.
No geral, nossa API de Texto para Fala é uma ferramenta valiosa para empresas e indivíduos que buscam adicionar capacidades de síntese de fala a seus aplicativos. É amigável ao usuário e fácil de usar, e suporta múltiplos idiomas, tornando-a acessível para uma ampla gama de casos de uso e públicos.
Envie o texto que você deseja converter e selecione o idioma. Receba o áudio pronto para uso.
Acessibilidade: Use a API para fornecer feedback falado para usuários com deficiências visuais, como ler texto em voz alta em sites ou em aplicativos móveis.
Assistentes de voz: Use a API para criar assistentes de voz e chatbots que podem interagir com os usuários por meio da fala.
Síntese de fala: Use a API para gerar saída falada a partir do texto escrito para uso em sistemas de telefonia, dispositivos de navegação e outras aplicações.
Conteúdo educacional: Use a API para converter conteúdo educacional escrito, como e-books ou guias de estudo, em áudio falado, tornando-o mais acessível para os alunos.
Podcasting: Use a API para gerar clipes de áudio de conteúdo escrito, como postagens de blog ou artigos, para uso em episódios de podcast.
Apresentações em vídeo: Use a API para gerar áudio falado de conteúdo escrito, como roteiros ou narrações, para uso em apresentações em vídeo ou animações.
Além das limitações de chamadas de API por mês, não há outras limitações.
Lista de idiomas suportados:
Converta seus textos em áudio com este Texto-para-Fala (TTS) Instantâneo usando vozes realistas
Você receberá a URL de onde seu arquivo MP3 está localizado. Mais tarde, você poderá baixá-lo se necessário
Gênero da voz. Opções: masculino, feminino ou neutro
Lista de idiomas suportados:
Por favor, adicione "text_premium_" (se conteúdo de texto) ou "ssml_premium_" (se código SSML) antes do código do idioma se você quiser usar a voz premium (por exemplo, para en_US será text_premium_en_US)
Converter - Recursos do endpoint
| Objeto | Descrição |
|---|---|
text |
[Obrigatório] Your text content. 10000 characters limit for any plan. |
gender_voice |
[Obrigatório] Gender voice. Options: male, female or neutral. |
language |
[Obrigatório] Language. Options: en_US, en_GB, en_IN, en_AU, pt_BR,pt_PT, fr_FR, fr_CA, de_DE, es_ES, sv_SE, ru_RU or tr_TR. Please add "text_premium_" (if text content) or "ssml_premium_" (if SSML code) before the language code if you want to use the premium voice (for e.g. for en_US will be text_premium_en_US) |
speakingRate |
Opcional Declare the speed of the voice. The ranges are between 0.25 (slow) and 1 (normal). |
{"message":"Your audio has been created!","audio_src":"https:\/\/getwoordfiles.s3.amazonaws.com\/9466387111736361142677ec4b65cc398.51505313.mp3","error":false,"total_chars":14,"remaining_chars":998814}
curl --location --request POST 'https://zylalabs.com/api/23/text+to+speech+api/84/convert?text=Check our amazing text to speech tool&gender_voice=female&language=en_US' --header 'Authorization: Bearer YOUR_API_KEY'
| Cabeçalho | Descrição |
|---|---|
Authorization
|
[Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito. |
Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.
A API de Texto para Fala usa algoritmos avançados de processamento de linguagem natural para analisar o texto de entrada e gerar a saída de fala correspondente Ela converte texto escrito em palavras faladas usando uma voz com som natural Você pode personalizar a saída selecionando diferentes vozes idiomas e ajustando a taxa de fala
A API pode ser usada para diversos fins incluindo síntese de fala assistentes de voz recursos de acessibilidade sistemas de telefonia dispositivos de navegação e mais Você pode integrá-la em suas aplicações para fornecer feedback falado ou gerar versões em áudio de conteúdo escrito Ela também pode ser usada para criar assistentes de voz chatbots podcasts e apresentações em vídeo
Sim, a API suporta múltiplas línguas Você pode passar texto em diferentes idiomas para a API e selecionar o idioma desejado para a saída de fala Isso permite que você forneça capacidades de síntese de fala em vários contextos linguísticos
Para usar a API, você precisa passar o texto que deseja converter em palavras faladas como entrada. Além disso, você pode selecionar o idioma desejado para a saída de fala. A API fornecerá uma URL de áudio como saída, que você pode usar para acessar e reproduzir o áudio gerado
Sim, você pode personalizar a voz e a taxa de fala com a API Ela oferece diferentes vozes para escolher permitindo que você selecione a que melhor se adequa à sua aplicação ou público Além disso, você pode ajustar a taxa de fala para controlar a velocidade com que o texto é falado proporcionando flexibilidade na saída de áudio
O endpoint Convert retorna uma resposta JSON contendo uma mensagem uma URL de origem de áudio uma flag de erro o número total de caracteres processados e os caracteres restantes disponíveis para conversão Esses dados estruturados permitem que os usuários acessem e utilizem facilmente o áudio gerado
Os campos principais nos dados de resposta incluem "mensagem" (confirmação da criação de áudio) "audio_src" (URL do arquivo de áudio gerado) "erro" (indica sucesso ou falha) "total_chars" (número de caracteres processados) e "remaining_chars" (caracteres restantes para conversão)
O endpoint Converter aceita parâmetros como "texto" (o texto de entrada a ser convertido), "idioma" (o código do idioma desejado) e "voz" (para especificar voz masculina, feminina ou neutra). Os usuários podem personalizar suas solicitações selecionando esses parâmetros para adequar a saída
Os dados de resposta do endpoint Convert estão organizados em um formato JSON. Inclui um objeto de nível superior contendo campos como "message", "audio_src", "error", "total_chars" e "remaining_chars", facilitando a análise e utilização em aplicações
Os casos de uso típicos para o endpoint Convert incluem gerar áudio para recursos de acessibilidade criar narrações para conteúdo educacional produzir clipes de áudio para podcasts e desenvolver assistentes de voz interativos ou chatbots que exigem síntese de fala
Os usuários podem utilizar a URL de áudio retornada incorporando-a em seus aplicativos permitindo a reprodução do áudio gerado Isso pode ser feito usando tags de áudio HTML ou integrando-a em aplicativos móveis garantindo que os usuários possam acessar e ouvir facilmente o conteúdo falado
Valores de parâmetros aceitos para o idioma no endpoint Convert incluem códigos de idioma como "en_US" para inglês americano "fr_FR" para francês e "de_DE" para alemão entre outros Os usuários podem especificar esses códigos para gerar áudio no idioma desejado
A precisão dos dados na API de Texto para Fala é mantida por meio de algoritmos avançados de processamento de linguagem natural que analisam o texto de entrada de forma contextual Atualizações e melhorias contínuas nos modelos subjacentes garantem que a saída de fala gerada permaneça natural e inteligível em todas as línguas suportadas
Nível de serviço:
100%
Tempo de resposta:
4.645ms
Nível de serviço:
100%
Tempo de resposta:
0ms
Nível de serviço:
100%
Tempo de resposta:
888ms
Nível de serviço:
100%
Tempo de resposta:
646ms
Nível de serviço:
100%
Tempo de resposta:
0ms
Nível de serviço:
100%
Tempo de resposta:
19ms
Nível de serviço:
100%
Tempo de resposta:
0ms
Nível de serviço:
100%
Tempo de resposta:
20ms
Nível de serviço:
100%
Tempo de resposta:
19ms
Nível de serviço:
100%
Tempo de resposta:
1.594ms