एचटीएमएल कोड एक्सट्रैक्शन एपीआई डेवलपर्स को किसी भी वेबपेज के कच्चे एचटीएमएल को प्राप्त और प्रोसेस करने का एक सरल लेकिन शक्तिशाली तरीका प्रदान करता है स्क्रैपर्स को मैन्युअली सेट करने, यूजर एजेंट संभालने या ब्लॉकिंग के बारे में चिंता करने के बजाय यह एपीआई साफ और सुसंगत एचटीएमएल डेटा प्रदान करता है जिसे आपके अनुप्रयोगों में सीधे इंटीग्रेट किया जा सकता है
इस एपीआई के साथ, आप:
किसी भी सार्वजनिक रूप से सुलभ यूआरएल से पूरा एचटीएमएल स्रोत कोड प्राप्त करें
डेटा पाइपलाइनों, क्रॉलर्स और सामग्री विश्लेषक को अतिरिक्त सेटअप के बिना पावर करें
निकाले गए एचटीएमएल का उपयोग वेब स्क्रैपर्स, सर्च इंजन्स, एसईओ टूल या एआई-चालित विश्लेषण बनाने के लिए आधार के रूप में करें
मेटाडेटा एक्सट्रैक्शन, डोम पार्सिंग और संरचित सामग्री जनरेशन जैसे वर्कफ़्लो को स्वचालित करें
चाहे आप डेटा खनन, वेबसाइटों की निगरानी या एसईओ टूल को बढ़ाने पर काम कर रहे हों एचटीएमएल एक्स्ट्रैक्शन एपीआई एचटीटीपी अनुरोधों, हैडर और साइट फ़ेचिंग का सारा भारी काम संभालकर समय बचाता है यह तेज, विश्वसनीय है और आपकी जरूरतों के साथ स्केल करने के लिए डिजाइन किया गया है
उपयोगकर्ताओं को एक यूआरएल इनपुट करने और फॉर्मेटेड एचटीएमएल कोड तथा अतिरिक्त मेटा डेटा निकालने की अनुमति देता है
एचटीएमएल निकालें - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
url |
[आवश्यक] The URL of the page you want to extract the HTML code from. |
{"link_count":1,"image_count":0,"heading_tag_count":{"h1":1,"h2":0,"h3":0,"h4":0,"h5":0,"h6":0},"p_count":2,"character_encoding":"utf-8","page_language":null,"total_size_kb":1.25,"character_count":1283,"word_count":127,"line_count":54,"title":"Example Domain","description":null,"keywords":null,"final_url":"https://www.example.com/","status_code":200,"headers":{"headers":{"date":"Fri, 05 Sep 2025 14:58:16 GMT","content-length":"648","vary":"Accept-Encoding","content-encoding":"gzip","last-modified":"Mon, 13 Jan 2025 20:11:20 GMT","content-range":"bytes 0-647/648","content-type":"text/html","etag":"\"84238dfc8092e5d9c0dac8ef93371a07:1736799080.121134\"","connection":"keep-alive","accept-ranges":"bytes","cache-control":"max-age=86000","alt-svc":"h3=\":443\"; ma=93600,h3-29=\":443\"; ma=93600","x-status-normalized":"206->200"}},"html_code":"<html>"}
curl --location --request GET 'https://zylalabs.com/api/10189/html+code+extractor+api/19560/extract+html?url=https://forkthis.io/' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
HTML निष्कर्षण एपीआई किसी भी सार्वजनिक रूप से सुलभ वेबपृष्ठ का कच्चा HTML स्रोत कोड एकल एपीआई कॉल के साथ प्राप्त करता है
आपको बस एक मान्य यूआरएल प्रदान करने की आवश्यकता है एपीआई पृष्ठ का एचटीएमएल लाएगा और वापस करेगा
API एक JSON प्रतिक्रिया लौटाता है जिसमें पूर्ण HTML सामग्री एक स्ट्रिंग के रूप में होती है अतिरिक्त डेटा जैसे लिंक_गिनती इमेज_गिनती हेडिंग_टैग_गिनती p_गिनती कैरेक्टर_एनकोडिंग पृष्ठ_भाषा कुल_आकार_kb कैरेक्टर_गिनती शब्द_गिनती पंक्ति_गिनती शीर्षक विवरण कीवर्ड अंतिम_यूआरएल स्थिति कोड और हेडर शामिल हैं
एपीआई संरचित एचटीएमएल लौटाता है जिसे ब्यूटीफुलसूप लाइब्रेरी के माध्यम से पार्स किया जाता है
बिल्कुल यह HTML से मेटाडेटा हेडिंग्स टैग्स और ऑन-पेज SEO तत्वों का विश्लेषण करने के लिए इस्तेमाल किया जा सकता है
वर्तमान संस्करण प्रति अनुरोध एक पृष्ठ निकालता है लेकिन आप अपनी एप्लिकेशन में कई URL को संभालने के लिए अनुरोधों को बैच कर सकते हैं
एपीआई को गति के लिए अनुकूलित किया गया है आमतौर पर इसे साइट की जटिलता और लोड समय के आधार पर मिलीसेकंड में प्रतिक्रिया मिलती है
वेब स्क्रैपिंग और डेटा संग्रहण एसईओ ऑडिटिंग और मेटाडेटा विश्लेषण सामग्री निगरानी और संग्रहण शोध और मशीन लर्निंग डेटा सेट खोज या क्रॉलर उपकरण बनाना
हाँ, एपीआई रीडायरेक्ट (301/302) का पालन करता है और अंतिम गंतव्य पृष्ठ का एचटीएमएल लौटाता है
एपीआई केवल सार्वजनिक रूप से उपलब्ध डेटा लाता है उपयोगकर्ता लक्ष्य वेबसाइट की सेवा की शर्तों और robots.txt का पालन करने के लिए जिम्मेदार हैं
एक्सट्रैक्ट एचटीएमएल एंडपॉइंट एक JSON ऑब्जेक्ट लौटाता है जिसमें अनुरोधित वेबपेज का पूरा एचटीएमएल कोड होता है साथ ही मेटाडेटा जैसे लिंक की संख्या इमेज की संख्या हेडिंग टैग्स कैरेक्टर एन्कोडिंग और अधिक
मुख्य क्षेत्रों में `link_count`, `image_count`, `heading_tag_count`, `title`, `description`, `final_url`, `status_code`, और `html_code` शामिल हैं ये पृष्ठ की संरचना और सामग्री के बारे में अंतर्दृष्टि प्रदान करते हैं
उत्तर को नेस्टेड फ़ील्ड्स के साथ एक JSON ऑब्जेक्ट के रूप में संरचित किया गया है मुख्य विशेषताओं में HTML सामग्री और मेटाडेटा शामिल हैं जो `title` और `link_count` जैसे विशिष्ट डेटा प्रोफाइल तक पहुँच की अनुमति देते हैं
यह एन्डपॉइंट वेबपेज की संरचना के बारे में जानकारी प्रदान करता है जिसमें लिंक, छवियों, शीर्षकों और अनुच्छेदों की गिनती शामिल है इसके साथ ही HTML सामग्री स्वयं और HTTP प्रतिक्रिया की जानकारी भी शामिल है
उपयोगकर्ता विभिन्न पृष्ठों से HTML निकालने के लिए विभिन्न URL निर्दिष्ट करके अनुरोधों को अनुकूलित कर सकते हैं API स्वचालित रूप से प्रदान किए गए URL को लाने और पार्स करने का प्रबंधन करता है
उदाहरण के लिए, `link_count` पृष्ठ पर हाइपरलिंक की संख्या को इंगित करता है, जबकि `heading_tag_count` विभिन्न शीर्षक स्तरों (h1, h2, आदि) का विवरण प्रदान करता है, जिससे उपयोगकर्ताओं को पृष्ठ की सामग्री की पदानुक्रम को समझने में मदद मिलती है
API निर्दिष्ट URLs से सीधे लाइव डेटा लाता है यह सुनिश्चित करते हुए कि HTML और मेटाडेटा वेबपेज की वर्तमान स्थिति को दर्शाते हैं साइट की उपलब्धता के अधीन
विशिष्ट उपयोग के मामलों में डेटा विश्लेषण के लिए वेब स्क्रैपिंग SEO ऑडिट्स जो ऑन-पेज तत्वों का मूल्यांकन करने के लिए हैं परिवर्तन के लिए सामग्री मॉनिटरिंग और खोज इंजनों या क्रॉलर्स के लिए उपकरण बनाना शामिल है
विशिष्ट उपयोग के मामलों में डेटा विश्लेषण के लिए वेब स्क्रैपिंग सामग्री अनुकूलन के लिए एसईओ ऑडिट और उन क्रॉलर या सर्च इंजन का निर्माण करना शामिल है जिन्हें प्रसंस्करण के लिए संरचित एचटीएमएल डेटा की आवश्यकता होती है
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
137ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
74ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
54ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
81ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,455ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
127ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
241ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
196ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
93ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
82ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,381ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,641ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,199ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,269ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
686ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
173ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,610ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,378ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,552ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
516ms