语音转文本 API

语音转文本API将口语转换为书面文本,具有高准确性,使应用程序能够实时转录和语音命令功能
通过 MCP 从您的 AI 代理使用此 API
支持 OpenClaw、Claude Code/Desktop、Cursor、Windsurf、Cline 以及任何兼容 MCP 的 AI 客户端。
文档和设置
通过封装此 MCP 创建技能: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

关于API:  

语音转文本API代表了一种复杂的技术解决方案,旨在弥补口语与书面文本之间的差距。从本质上讲,这个API解释语音并将其转换为准确的文本表示。利用神经网络和大量数据集,它可以理解和转录多种语言、口音和方言,确保在不同语言环境中具有广泛的适用性。

此外,语音转文本API在设计时考虑了可扩展性。它可以处理不同音量的语音数据,从简短的语音命令到较长的口语段落。这种可扩展性确保API能够处理单个请求和大规模部署,使其成为不同应用的多功能工具。

总体而言,语音转文本API在自然语言处理和语音识别领域代表了重大的突破。结合尖端技术与以用户为中心的设计,它提供了一个将口语转换为书面文本的强大工具。其多功能性、准确性和适应性使其成为从日常交流到专业行业用例的广泛应用的宝贵资源。

 

此API接收什么,您的API提供什么(输入/输出)?

API接收音频文件并返回文本。

 

此API最常见的使用案例是什么?

  1. 语音助手:增强虚拟助手如Siri、Alexa和谷歌助手的功能,使其能够理解和处理用户用自然语言发出的命令和查询。

    转录服务:自动将会议、访谈和讲座的音频转换为文本,以用于文档记录和保存。

    客户服务:通过转录客户与服务代理之间的语音互动来改善客户支持,从而实现更好的分析和跟进。

    语音分析:分析口语互动,以获取客户情感、行为模式和在呼叫中心或市场营销活动中的参与度的洞察。

    语言学习:通过转录口语练习课程并提供发音和流利度反馈来支持语言学习者。

    内容创建:通过转录访谈、播客或演讲来帮助内容创作者和记者,这些内容可以用于文章、博客或其他书面材料。

     

您的计划是否有任何限制?

除了API调用的数量,没有其他限制。

API 文档

端点


要使用此端点,您必须指定一个mp3文件以接收音频文本


                                                                            
POST https://www.zylalabs.com/api/4914/%e8%af%ad%e9%9f%b3%e8%bd%ac%e6%96%87%e6%9c%ac+api/6186/%e8%8e%b7%e5%8f%96%e6%96%87%e6%9c%ac
                                                                            
                                                                        

获取文本 - 端点功能

对象 描述
请求体 [必需] 文件二进制
测试端点

API 示例响应

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {
  "text": "Hola a todos, espero que se encuentren bien."
}
                                                                                                                                                                                                                    
                                                                                                    

获取文本 - 代码片段


    curl --location 'https://zylalabs.com/api/4914/%e8%af%ad%e9%9f%b3%e8%bd%ac%e6%96%87%e6%9c%ac+api/6186/%e8%8e%b7%e5%8f%96%e6%96%87%e6%9c%ac' \
    --header 'Content-Type: multipart/form-data' \ 
    --form 'image=@"FILE_PATH"'


API 访问密钥和身份验证

注册后,每个开发者都会被分配一个个人 API 访问密钥,这是一个唯一的字母和数字组合,用于访问我们的 API 端点。要使用 语音转文本 API 进行身份验证,只需在 Authorization 标头中包含您的 bearer token。
标头
标头 描述
授权 [必需] 应为 Bearer access_key. 订阅后,请查看上方的"您的 API 访问密钥"。

简单透明的定价

无长期承诺。随时升级、降级或取消。 免费试用包括最多 50 个请求。

🚀 企业版

起价
$ 10,000/年


  • 自定义数量
  • 自定义速率限制
  • 专业客户支持
  • 实时 API 监控

客户喜爱的功能

  • ✔︎ 仅支付成功请求
  • ✔︎ 7 天免费试用
  • ✔︎ 多语言支持
  • ✔︎ 一个 API 密钥,所有 API。
  • ✔︎ 直观的仪表板
  • ✔︎ 全面的错误处理
  • ✔︎ 开发者友好的文档
  • ✔︎ Postman 集成
  • ✔︎ 安全的 HTTPS 连接
  • ✔︎ 可靠的正常运行时间

语音转文本 API FAQs

要使用此API,用户必须指定一个音频文件

语音转文本API使用先进的算法将口语转换为书面文本,实现对音频输入的准确转录和理解

Zyla提供了几乎所有编程语言的广泛集成方法。您可以根据需要使用这些代码与您的项目集成

有不同的计划适合每个人,包括每天有限请求量的免费计划,但它的速率受到限制以防止滥用该服务

接收音频文件的文本以JSON格式

端点返回以JSON格式提供的音频文件的转录文本 响应中的主要字段是"text",它包含所说语言的书面表示

响应数据中的关键字段是"text",它包含音频文件的转录内容。该字段提供所说输入的完整转录

响应数据采用JSON格式构建,包含一个键值对。键为"text",值为从音频输入中转录的文本

该端点的主要参数是音频文件,必须为MP3格式 用户应确保音频文件清晰以获得最佳转录准确性

数据准确性通过先进的算法和经过多样化数据集训练的神经网络得以维持,使得API能够有效理解各种语言、口音和方言

典型的使用案例包括会议的实时转录 增强语音助手 视频生成字幕 提供采访或讲座的记录

用户可以将返回的文本用于文档编制、分析或集成到应用程序中。例如,转录可以用于创建会议记录或增强内容的可访问性

该端点提供音频文件中的口语转录,使用户能够将语音命令、讲座或对话转换为书面文本,以用于各种应用

一般常见问题

Zyla API Hub 就像一个大型 API 商店,您可以在一个地方找到数千个 API。我们还为所有 API 提供专门支持和实时监控。注册后,您可以选择要使用的 API。请记住,每个 API 都需要自己的订阅。但如果您订阅多个 API,您将为所有这些 API 使用相同的密钥,使事情变得更简单。

价格以 USD(美元)、EUR(欧元)、CAD(加元)、AUD(澳元)和 GBP(英镑)列出。我们接受所有主要的借记卡和信用卡。我们的支付系统使用最新的安全技术,由 Stripe 提供支持,Stripe 是世界上最可靠的支付公司之一。如果您在使用卡片付款时遇到任何问题,请通过 [email protected]


此外,如果您已经以这些货币中的任何一种(USD、EUR、CAD、AUD、GBP)拥有有效订阅,该货币将保留用于后续订阅。只要您没有任何有效订阅,您可以随时更改货币。

定价页面上显示的本地货币基于您 IP 地址的国家/地区,仅供参考。实际价格以 USD(美元)为单位。当您付款时,即使您在我们的网站上看到以本地货币显示的等值金额,您的卡片对账单上也会以美元显示费用。这意味着您不能直接使用本地货币付款。

有时,银行可能会因其欺诈保护设置而拒绝收费。我们建议您首先联系您的银行,检查他们是否阻止了我们的收费。此外,您可以访问账单门户并更改关联的卡片以进行付款。如果这些方法不起作用并且您需要进一步帮助,请通过 [email protected]

价格由月度或年度订阅决定,具体取决于所选计划。

API 调用根据成功请求从您的计划中扣除。每个计划都包含您每月可以进行的特定数量的调用。只有成功的调用(由状态 200 响应指示)才会计入您的总数。这确保失败或不完整的请求不会影响您的月度配额。

Zyla API Hub 采用月度订阅系统。您的计费周期将从您购买付费计划的那一天开始,并在下个月的同一日期续订。因此,如果您想避免未来的费用,请提前取消订阅。

要升级您当前的订阅计划,只需转到 API 的定价页面并选择您要升级到的计划。升级将立即生效,让您立即享受新计划的功能。请注意,您之前计划中的任何剩余调用都不会转移到新计划,因此在升级时请注意这一点。您将被收取新计划的全部金额。

要检查您本月剩余多少 API 调用,请参考响应标头中的 "X-Zyla-API-Calls-Monthly-Remaining" 字段。例如,如果您的计划允许每月 1,000 个请求,而您已使用 100 个,则响应标头中的此字段将显示 900 个剩余调用。

要查看您的计划允许的最大 API 请求数,请检查 "X-Zyla-RateLimit-Limit" 响应标头。例如,如果您的计划包括每月 1,000 个请求,此标头将显示 1,000。

"X-Zyla-RateLimit-Reset" 标头显示您的速率限制重置之前的秒数。这告诉您何时您的请求计数将重新开始。例如,如果它显示 3,600,则意味着还有 3,600 秒直到限制重置。

是的,您可以随时通过访问您的账户并在账单页面上选择取消选项来取消您的计划。请注意,升级、降级和取消会立即生效。此外,取消后,您将不再有权访问该服务,即使您的配额中还有剩余调用。

您可以通过我们的聊天渠道联系我们以获得即时帮助。我们始终在线,时间为上午 8 点至下午 5 点(EST)。如果您在该时间之后联系我们,我们将尽快回复您。此外,您可以通过 [email protected]

为了让您有机会在没有任何承诺的情况下体验我们的 API,我们提供 7 天免费试用,允许您免费进行最多 50 次 API 调用。此试用只能使用一次,因此我们建议将其应用于您最感兴趣的 API。虽然我们的大多数 API 都提供免费试用,但有些可能不提供。试用在 7 天后或您进行了 50 次请求后结束,以先发生者为准。如果您在试用期间达到 50 次请求限制,您需要"开始您的付费计划"以继续发出请求。您可以在个人资料中的订阅 -> 选择您订阅的 API -> 定价标签下找到"开始您的付费计划"按钮。或者,如果您在第 7 天之前不取消订阅,您的免费试用将结束,您的计划将自动计费,授予您访问计划中指定的所有 API 调用的权限。请记住这一点以避免不必要的费用。

7 天后,您将被收取试用期间订阅的计划的全额费用。因此,在试用期结束前取消很重要。因忘记及时取消而提出的退款请求不被接受。

当您订阅 API 免费试用时,您可以进行最多 50 次 API 调用。如果您希望超出此限制进行额外的 API 调用,API 将提示您执行"开始您的付费计划"。您可以在个人资料中的订阅 -> 选择您订阅的 API -> 定价标签下找到"开始您的付费计划"按钮。

付款订单在每月 20 日至 30 日之间处理。如果您在 20 日之前提交请求,您的付款将在此时间范围内处理。


相关 API


您可能还喜欢