HTML代码提取API为开发者提供了一种简单而强大的方式来检索和处理任何网页的原始HTML。无需手动设置抓取器、处理用户代理或担心被封锁,该API提供了干净且一致的HTML数据,可以直接集成到您的应用中。
使用此API,您可以:
从任何公开可访问的URL获取完整的HTML源代码。
为数据管道、爬虫和内容分析工具提供支持,无需额外设置。
使用提取的HTML作为构建网络抓取器、搜索引擎、SEO工具或AI驱动分析的基础。
自动化工作流程,如元数据提取、DOM解析和结构化内容生成。
无论您是在进行数据挖掘、监控网站,还是增强SEO工具,HTML提取API通过处理所有HTTP请求、头部和网站获取,节省了时间。它快速、可靠,并且设计为与您的需求扩展。
允许用户输入URL并提取格式化的HTML代码和额外的元数据
提取HTML - 端点功能
| 对象 | 描述 |
|---|---|
url |
[必需] The URL of the page you want to extract the HTML code from. |
{"link_count":1,"image_count":0,"heading_tag_count":{"h1":1,"h2":0,"h3":0,"h4":0,"h5":0,"h6":0},"p_count":2,"character_encoding":"utf-8","page_language":null,"total_size_kb":1.25,"character_count":1283,"word_count":127,"line_count":54,"title":"Example Domain","description":null,"keywords":null,"final_url":"https://www.example.com/","status_code":200,"headers":{"headers":{"date":"Fri, 05 Sep 2025 14:58:16 GMT","content-length":"648","vary":"Accept-Encoding","content-encoding":"gzip","last-modified":"Mon, 13 Jan 2025 20:11:20 GMT","content-range":"bytes 0-647/648","content-type":"text/html","etag":"\"84238dfc8092e5d9c0dac8ef93371a07:1736799080.121134\"","connection":"keep-alive","accept-ranges":"bytes","cache-control":"max-age=86000","alt-svc":"h3=\":443\"; ma=93600,h3-29=\":443\"; ma=93600","x-status-normalized":"206->200"}},"html_code":"<html>"}
curl --location --request GET 'https://zylalabs.com/api/10189/html+code+extractor+api/19560/extract+html?url=https://forkthis.io/' --header 'Authorization: Bearer YOUR_API_KEY'
| 标头 | 描述 |
|---|---|
授权
|
[必需] 应为 Bearer access_key. 订阅后,请查看上方的"您的 API 访问密钥"。 |
无长期承诺。随时升级、降级或取消。 免费试用包括最多 50 个请求。
HTML提取API通过一次API调用检索任何公开可访问网页的原始HTML源代码
您只需提供一个有效的URL API将获取并返回页面的HTML
API返回一个包含完整HTML内容作为字符串的JSON响应。此外还包括其他数据,例如link_count、image_count、heading_tag_count、p_count、character_encoding、page_language、total_size_kb、character_count、word_count、line_count、title、description、keywords、final_url、status_code和headers
API返回结构化的HTML,通过BeautifulSoup库进行解析
绝对可以 它可以直接从HTML中分析元数据 标题 标签和页面SEO元素
当前版本每次请求提取一页,但您可以在应用程序中批量请求以处理多个 URL
该API经过优化以提高速度,通常在几毫秒内响应,具体取决于网站的复杂性和加载时间
网络爬虫和数据收集 SEO审计和元数据分析 内容监测和归档 研究和机器学习数据集 构建搜索或爬虫工具
是的 API 遵循重定向(301/302)并返回最终目标页面的 HTML
该API仅获取公开可用的数据 用户有责任遵守目标网站的服务条款和robots.txt
提取HTML端点返回一个JSON对象,其中包含请求网页的完整HTML代码,以及链接数量、图像数量、标题标签、字符编码等元数据
关键字段包括 `link_count`、`image_count`、`heading_tag_count`、`title`、`description`、`final_url`、`status_code` 和 `html_code` 这些提供了页面结构和内容的洞察
响应被结构化为一个具有嵌套字段的JSON对象 主要属性包括HTML内容和元数据 允许轻松访问特定数据点如标题和链接计数
该端点提供有关网页结构的信息,包括链接、图像、标题和段落的计数,以及HTML内容本身和HTTP响应详细信息
用户可以通过指定不同的URL来自定义请求,从多个页面提取HTML API自动处理提供的URL的获取和解析
例如 `link_count` 表示页面上的超链接数量 而 `heading_tag_count` 提供不同标题级别的细分(h1 h2 等)帮助用户理解页面的内容层次
该API直接从指定的URL获取实时数据,确保HTML和元数据反映网页的当前状态,但需受网站可用性的限制
典型的用例包括数据分析的网络抓取 SEO审计以评估页面元素 内容监控以检测变化 以及为搜索引擎或爬虫构建工具
典型的用例包括用于数据分析的网络爬虫 优化内容的SEO审计 以及需要结构化HTML数据进行处理的爬虫或搜索引擎
Zyla API Hub 就像一个大型 API 商店,您可以在一个地方找到数千个 API。我们还为所有 API 提供专门支持和实时监控。注册后,您可以选择要使用的 API。请记住,每个 API 都需要自己的订阅。但如果您订阅多个 API,您将为所有这些 API 使用相同的密钥,使事情变得更简单。
价格以 USD(美元)、EUR(欧元)、CAD(加元)、AUD(澳元)和 GBP(英镑)列出。我们接受所有主要的借记卡和信用卡。我们的支付系统使用最新的安全技术,由 Stripe 提供支持,Stripe 是世界上最可靠的支付公司之一。如果您在使用卡片付款时遇到任何问题,请通过 [email protected]
此外,如果您已经以这些货币中的任何一种(USD、EUR、CAD、AUD、GBP)拥有有效订阅,该货币将保留用于后续订阅。只要您没有任何有效订阅,您可以随时更改货币。
定价页面上显示的本地货币基于您 IP 地址的国家/地区,仅供参考。实际价格以 USD(美元)为单位。当您付款时,即使您在我们的网站上看到以本地货币显示的等值金额,您的卡片对账单上也会以美元显示费用。这意味着您不能直接使用本地货币付款。
有时,银行可能会因其欺诈保护设置而拒绝收费。我们建议您首先联系您的银行,检查他们是否阻止了我们的收费。此外,您可以访问账单门户并更改关联的卡片以进行付款。如果这些方法不起作用并且您需要进一步帮助,请通过 [email protected]
价格由月度或年度订阅决定,具体取决于所选计划。
API 调用根据成功请求从您的计划中扣除。每个计划都包含您每月可以进行的特定数量的调用。只有成功的调用(由状态 200 响应指示)才会计入您的总数。这确保失败或不完整的请求不会影响您的月度配额。
Zyla API Hub 采用月度订阅系统。您的计费周期将从您购买付费计划的那一天开始,并在下个月的同一日期续订。因此,如果您想避免未来的费用,请提前取消订阅。
要升级您当前的订阅计划,只需转到 API 的定价页面并选择您要升级到的计划。升级将立即生效,让您立即享受新计划的功能。请注意,您之前计划中的任何剩余调用都不会转移到新计划,因此在升级时请注意这一点。您将被收取新计划的全部金额。
要检查您本月剩余多少 API 调用,请参考响应标头中的 "X-Zyla-API-Calls-Monthly-Remaining" 字段。例如,如果您的计划允许每月 1,000 个请求,而您已使用 100 个,则响应标头中的此字段将显示 900 个剩余调用。
要查看您的计划允许的最大 API 请求数,请检查 "X-Zyla-RateLimit-Limit" 响应标头。例如,如果您的计划包括每月 1,000 个请求,此标头将显示 1,000。
"X-Zyla-RateLimit-Reset" 标头显示您的速率限制重置之前的秒数。这告诉您何时您的请求计数将重新开始。例如,如果它显示 3,600,则意味着还有 3,600 秒直到限制重置。
是的,您可以随时通过访问您的账户并在账单页面上选择取消选项来取消您的计划。请注意,升级、降级和取消会立即生效。此外,取消后,您将不再有权访问该服务,即使您的配额中还有剩余调用。
您可以通过我们的聊天渠道联系我们以获得即时帮助。我们始终在线,时间为上午 8 点至下午 5 点(EST)。如果您在该时间之后联系我们,我们将尽快回复您。此外,您可以通过 [email protected]
为了让您有机会在没有任何承诺的情况下体验我们的 API,我们提供 7 天免费试用,允许您免费进行最多 50 次 API 调用。此试用只能使用一次,因此我们建议将其应用于您最感兴趣的 API。虽然我们的大多数 API 都提供免费试用,但有些可能不提供。试用在 7 天后或您进行了 50 次请求后结束,以先发生者为准。如果您在试用期间达到 50 次请求限制,您需要"开始您的付费计划"以继续发出请求。您可以在个人资料中的订阅 -> 选择您订阅的 API -> 定价标签下找到"开始您的付费计划"按钮。或者,如果您在第 7 天之前不取消订阅,您的免费试用将结束,您的计划将自动计费,授予您访问计划中指定的所有 API 调用的权限。请记住这一点以避免不必要的费用。
7 天后,您将被收取试用期间订阅的计划的全额费用。因此,在试用期结束前取消很重要。因忘记及时取消而提出的退款请求不被接受。
当您订阅 API 免费试用时,您可以进行最多 50 次 API 调用。如果您希望超出此限制进行额外的 API 调用,API 将提示您执行"开始您的付费计划"。您可以在个人资料中的订阅 -> 选择您订阅的 API -> 定价标签下找到"开始您的付费计划"按钮。
付款订单在每月 20 日至 30 日之间处理。如果您在 20 日之前提交请求,您的付款将在此时间范围内处理。
服务级别:
100%
响应时间:
7,660ms
服务级别:
100%
响应时间:
68ms
服务级别:
100%
响应时间:
8,219ms
服务级别:
100%
响应时间:
2,788ms
服务级别:
100%
响应时间:
2,625ms
服务级别:
100%
响应时间:
8,257ms
服务级别:
100%
响应时间:
910ms
服务级别:
100%
响应时间:
4,048ms
服务级别:
100%
响应时间:
2,537ms
服务级别:
89%
响应时间:
4,622ms
服务级别:
100%
响应时间:
567ms
服务级别:
100%
响应时间:
1,779ms
服务级别:
100%
响应时间:
0ms
服务级别:
100%
响应时间:
3,147ms
服务级别:
100%
响应时间:
239ms
服务级别:
100%
响应时间:
1,409ms
服务级别:
100%
响应时间:
237ms
服务级别:
100%
响应时间:
0ms
服务级别:
100%
响应时间:
237ms
服务级别:
100%
响应时间:
237ms