स्पीच एनालिसिस एपीआई ऑडियो को texto में सटीकता से परिवर्तित करता है जो विभिन्न अनुप्रयोगों में निर्बाध रूप से एकीकृत होता है यह उन्नत स्पीच रिकग्निशन और एआई का उपयोग करके विभिन्न उद्योगों और उपयोग के मामलों के लिए सटीक प्रतिलिपियाँ प्रदान करता है चाहे वह लाइव स्पीच प्रोसेसिंग हो या प्री-रिकॉर्डेड ऑडियो फाइलें यह एपीआई विश्वसनीय और त्रुटि-मुक्त परिवर्तनों को सुनिश्चित करता है
इस एपीआई की एक विशेषता इसकी बहुभाषी समर्थन है जो कई भाषाओं में उच्च-सटीकता वाली प्रतिलिपि बनाने की सुविधा प्रदान करती है यह इसे विभिन्न भाषाई संदर्भों में प्रतिलिपियों की आवश्यकता रखने वाले उपयोगकर्ताओं के लिए एक अनिवार्य उपकरण बनाता है
पाठ प्राप्त करें - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
url |
[आवश्यक] Indicates a URL |
{"success":true,"audio_file":"https://s19.aconvert.com/convert/p3r68-cdx67/c2iut-davq3.mp3","output":{"text":"Oggi che il sole.","result":{"text":"Oggi che il sole.","word_count":4,"vtt":"WEBVTT\n\n00.000 --> 01.120\nOggi che il sole.","words":[{"word":"Oggi","start":0,"end":0.3400000035762787},{"word":"che","start":0.3400000035762787,"end":0.5400000214576721},{"word":"il","start":0.5400000214576721,"end":0.7200000286102295},{"word":"sole.","start":0.7200000286102295,"end":1.1200000047683716}]}}}
curl --location --request POST 'https://zylalabs.com/api/6371/speech+analysis+api/9136/obtain+text?url=https://s19.aconvert.com/convert/p3r68-cdx67/c2iut-davq3.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
स्पीच एनालिसिस एपीआई ऑडियो इनपुट से ट्रांसक्राइब किया गया टेक्स्ट लौटाता है आउटपुट में टेक्स्ट फॉर्मेट में पहचानी गई स्पीच शामिल होती है जिसका उपयोग उपशीर्षक दस्तावेज़ीकरण या विश्लेषण जैसे विभिन्न अनुप्रयोगों के लिए किया जा सकता है
प्रतिक्रिया डेटा के प्रमुख क्षेत्र आमतौर पर "परिवर्तित पाठ" के लिए "ट्रांसक्रिप्शन" "भाषा" जो पहचान की गई भाषा को इंगित करती है और "विश्वास" जो ट्रांसक्रिप्शन की सटीकता को दर्शाती है शामिल होते हैं
POST Obtain Text एंडपॉइंट के लिए प्राथमिक पैरामीटर "audio_url" है जो ट्रांसक्राइब किए जाने वाले ऑडियो फ़ाइल का यूआरएल निर्दिष्ट करता है अतिरिक्त पैरामीटर "language" शामिल हो सकते हैं जो ट्रांसक्रिप्शन के लिए इच्छित भाषा को निर्दिष्ट करते हैं
प्रतिक्रिया डेटा JSON प्रारूप में व्यवस्थित है जिसमें कुंजी-मूल्य जोड़े शामिल हैं मुख्य संरचना में ट्रांसक्रिप्शन भाषा और आत्मविश्वास स्कोर के लिए क्षेत्र शामिल हैं जो अनुप्रयोगों में आसान पार्सिंग और एकीकरण की अनुमति देता है
टीपिकल उपयोग के मामले में वीडियो के लिए सबटाइटल बनाना बैठकों या इंटरव्यू के लिए ट्रांस्क्रिप्ट तैयार करना सुनने में अक्षम उपयोगकर्ताओं के लिए पहुंच को बढ़ाना और विभिन्न उद्योगों में अंतर्दृष्टियों के लिए बोले गए_CONTENT का विश्लेषण करना शामिल है
डेटा सटीकता उन्नत भाषण पहचान एल्गोरिदम और विविध डेटा सेटों पर निरंतर प्रशिक्षण के माध्यम से बनाए रखी जाती है एपीआई गलती को कम करने और ट्रांसक्रिप्शन की विश्वसनीयता को सुधारने के लिए गुणवत्ता जांच भी करता है
उपयोगकर्ता "भाषा" पैरामीटर निर्धारित करके अपनी अनुरोधों को अनुकूलित कर सकते हैं ताकि ट्रांसक्रिप्शन के लिए विशिष्ट भाषाओं को लक्षित किया जा सके यह ऑडियो सामग्री की भाषाई संदर्भ के आधार पर अनुकूलित आउटपुट की अनुमति देता है
मानक डेटा पैटर्न में सही वाक्यों के साथ उचित विराम चिह्न और बड़े अक्षर शामिल होते हैं उपयोगकर्ता ऑडियो गुणवत्ता बोलने वालों के उच्चारण और पृष्ठभूमि शोर के स्तर के आधार पर सटीकता में भिन्नताएं अपेक्षित कर सकते हैं
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
373ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
728ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,164ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
687ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
302ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
6,955ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,658ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
418ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
197ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
226ms