Envía una solicitud POST con el enlace de audio y el idioma para recibir la transcripción del texto.
Transcripción de audio a texto - Características del Endpoint
| Objeto | Descripción |
|---|---|
Cuerpo de la Solicitud |
[Requerido] Json |
{"data": "Jacadi tous les gar\u00e7ons toutes les filles"}
curl --location --request POST 'https://zylalabs.com/api/5341/speech+capture+api/6903/audio+to+text' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{
"audioUrl": "https://www.lightbulblanguages.co.uk/resources/audio/jacquesadit.mp3",
"language": "fr-FR"
}'
| Encabezado | Descripción |
|---|---|
Autorización
|
[Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito. |
Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.
Envía un archivo de audio o una URL con el idioma y recibe la transcripción en texto.
Una API de transcripción que convierte archivos de audio en texto para el análisis de KPI y accesibilidad.
Recibe archivos de audio o URLs, devuelve transcripciones de texto para un fácil análisis y accesibilidad.
Transcripción de interacciones en ventas y soporte. Superación de captchas de audio. Creación de informes y KPIs a partir de audio.
Plan Básico: 1 solicitud por segundo. Plan Pro: 1 solicitud por segundo. Plan Pro Plus: 2 solicitudes por segundo. Plan Premium: 2 solicitudes por segundo. Plan Elite: 5 solicitudes por segundo.
Hay diferentes planes que se adaptan a todos, incluyendo una prueba gratuita para una pequeña cantidad de solicitudes, pero su tasa está limitada para prevenir el abuso del servicio.
La API utiliza claves de API para la autenticación. Para acceder a la API, incluya su clave de API en el encabezado de la solicitud. La clave de API se proporciona al registrarse y debe mantenerse segura.
La API devuelve información detallada sobre la edad y la historia de un dominio, incluyendo años, meses y días desde su creación, así como las fechas de expiración y actualización.
La API de Captura de Discurso devuelve transcripciones de texto derivadas de archivos de audio o URL. La salida es un objeto JSON que contiene el texto transcrito, lo que permite una fácil integración en aplicaciones para análisis o informes adicionales.
El campo principal en los datos de respuesta es "data", que contiene el texto transcrito. Este campo proporciona la transcripción completa del audio de entrada, lo que permite a los usuarios extraer información significativa del contenido.
El endpoint acepta parámetros como "audio_url" (el enlace al archivo de audio) y "language" (el idioma del audio). Los usuarios pueden personalizar sus solicitudes especificando estos parámetros para asegurar una transcripción precisa.
Los datos de respuesta están estructurados en formato JSON, con una única clave "data" que contiene el texto transcrito. Esta estructura simple permite a los desarrolladores analizar y utilizar fácilmente la transcripción en sus aplicaciones.
La API de Captura de Voz procesa archivos de audio proporcionados por los usuarios, asegurando que la transcripción se base únicamente en el contenido de audio enviado. La calidad de la transcripción depende de la claridad y calidad de la entrada de audio.
La precisión de los datos se mantiene a través de algoritmos avanzados de reconocimiento de voz que se refinan continuamente. La API admite múltiples idiomas y dialectos, lo que mejora su capacidad para transcribir con precisión diversas entradas de audio.
Los casos de uso típicos incluyen generar transcripciones de llamadas de ventas, analizar interacciones con los clientes para mejorar el servicio y convertir captchas auditivos en texto para mejorar la accesibilidad en la navegación web.
Si la API devuelve resultados parciales o vacíos, los usuarios deben verificar la calidad del audio y asegurarse de que se haya configurado el parámetro de idioma correcto. Además, proporcionar un audio más claro puede mejorar la precisión y la completitud de la transcripción.
Nivel de Servicio:
100%
Tiempo de Respuesta:
646ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
0ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
753ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.277ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
77ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
0ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
8.644ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
84ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
731ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
0ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.930ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.053ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
360ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
11.537ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
694ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
277ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
2.441ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
2.053ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
73ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.599ms