Extrator de Código HTML API

Extraia conteúdo HTML limpo e estruturado de qualquer página da web com uma única chamada de API
Use esta API do seu agente de IA via MCP
Funciona com OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline e qualquer cliente de IA compatível com MCP.
Docs e configuração
Crie uma skill envolvendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

API de Extração de Código HTML oferece aos desenvolvedores uma forma simples, mas poderosa, de recuperar e processar o HTML bruto de qualquer página da web. Em vez de configurar manualmente raspadores, gerenciar agentes de usuário ou se preocupar com bloqueios, esta API fornece dados HTML limpos e consistentes que podem ser integrados diretamente em suas aplicações.

Com esta API, você pode:

Buscar o código-fonte HTML completo de qualquer URL publicamente acessível.

Potencializar pipelines de dados, rastreadores e analisadores de conteúdo sem configuração extra.

Usar o HTML extraído como base para construir raspadores da web, mecanismos de busca, ferramentas de SEO ou análises impulsionadas por IA.

Automatizar fluxos de trabalho como extração de metadados, análise de DOM e geração de conteúdo estruturado.

Seja você está trabalhando em mineração de dados, monitoramento de sites ou aprimoramento de ferramentas de SEO, a API de Extração de HTML economiza tempo ao lidar com toda a carga pesada de solicitações HTTP, cabeçalhos e recuperação de sites. É rápida, confiável e projetada para escalar com suas necessidades.

Documentação da API

Endpoints


Permite que os usuários insiram uma URL e extraiam código HTML formatado além de metadados extras



                                                                            
GET https://www.zylalabs.com/api/10189/html+code+extractor+api/19560/extract+html
                                                                            
                                                                        

Extrair HTML - Recursos do endpoint

Objeto Descrição
url [Obrigatório] The URL of the page you want to extract the HTML code from.
Testar endpoint

RESPOSTA DE EXEMPLO DA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"link_count":1,"image_count":0,"heading_tag_count":{"h1":1,"h2":0,"h3":0,"h4":0,"h5":0,"h6":0},"p_count":2,"character_encoding":"utf-8","page_language":null,"total_size_kb":1.25,"character_count":1283,"word_count":127,"line_count":54,"title":"Example Domain","description":null,"keywords":null,"final_url":"https://www.example.com/","status_code":200,"headers":{"headers":{"date":"Fri, 05 Sep 2025 14:58:16 GMT","content-length":"648","vary":"Accept-Encoding","content-encoding":"gzip","last-modified":"Mon, 13 Jan 2025 20:11:20 GMT","content-range":"bytes 0-647/648","content-type":"text/html","etag":"\"84238dfc8092e5d9c0dac8ef93371a07:1736799080.121134\"","connection":"keep-alive","accept-ranges":"bytes","cache-control":"max-age=86000","alt-svc":"h3=\":443\"; ma=93600,h3-29=\":443\"; ma=93600","x-status-normalized":"206->200"}},"html_code":"<html>"}
                                                                                                                                                                                                                    
                                                                                                    

Extrair HTML - TRECHOS DE CÓDIGO


curl --location --request GET 'https://zylalabs.com/api/10189/html+code+extractor+api/19560/extract+html?url=https://forkthis.io/' --header 'Authorization: Bearer YOUR_API_KEY' 


    

Chave de acesso à API e autenticação

Após se cadastrar, cada desenvolvedor recebe uma chave de acesso à API pessoal, uma combinação única de letras e dígitos para acessar nosso endpoint de API. Para autenticar com a Extrator de Código HTML API basta incluir seu token Bearer no cabeçalho Authorization.
Cabeçalhos
Cabeçalho Descrição
Authorization [Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito.

Preços simples e transparentes

Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.

🚀 Empresarial

A partir de
$ 10.000/Ano


  • Volume personalizado
  • Limite de taxa personalizado
  • Suporte ao cliente especializado
  • Monitoramento de API em tempo real

Recursos favoritos dos clientes

  • ✔︎ Pague apenas por requisições bem-sucedidas
  • ✔︎ Teste 7 dias gratis
  • ✔︎ Suporte multilíngue
  • ✔︎ Uma chave de API, todas as APIs.
  • ✔︎ Painel intuitivo
  • ✔︎ Tratamento de erros abrangente
  • ✔︎ Documentação amigável para desenvolvedores
  • ✔︎ Integração com Postman
  • ✔︎ Conexões HTTPS seguras
  • ✔︎ Alta disponibilidade

Extrator de Código HTML API FAQs

A API de Extração de HTML recupera o código-fonte HTML bruto de qualquer página da web acessível publicamente com uma única chamada de API

Você só precisa fornecer uma URL válida A API irá buscar e retornar o HTML da página

A API retorna uma resposta JSON contendo o conteúdo HTML completo como uma string Além de dados adicionais como link_count image_count heading_tag_count p_count character_encoding page_language total_size_kb character_count word_count line_count title description keywords final_url status_code e headers

A API retorna HTML estruturado que é analisado através da biblioteca BeautifulSoup

Absolutamente Pode ser usado para analisar metadados cabeçalhos tags e elementos de SEO na página diretamente do HTML

A versão atual extrai uma página por solicitação, mas você pode agrupar solicitações em seu aplicativo para lidar com várias URLs

A API é otimizada para velocidade tipicamente respondendo em milissegundos dependendo da complexidade e do tempo de carregamento do site

Raspagem de dados e coleta de dados Auditoria de SEO e análise de metadados Monitoramento e arquivamento de conteúdo Pesquisa e conjuntos de dados de aprendizado de máquina Construção de ferramentas de busca ou de rastreamento

Sim a API segue redirecionamentos 301 302 e retorna o HTML da página de destino final

A API busca apenas dados disponíveis publicamente Os usuários são responsáveis por cumprir os termos de serviço do site de destino e o robots.txt

O endpoint Extrair HTML retorna um objeto JSON contendo o código HTML completo da página da web solicitada, juntamente com metadados como contagem de links, contagem de imagens, tags de cabeçalho, codificação de caracteres e mais

Os campos principais incluem `link_count`, `image_count`, `heading_tag_count`, `title`, `description`, `final_url`, `status_code` e `html_code`. Estes fornecem informações sobre a estrutura e o conteúdo da página

A resposta está estruturada como um objeto JSON com campos aninhados Atributos principais incluem conteúdo HTML e metadados permitindo acesso fácil a pontos de dados específicos como `title` e `link_count`

O endpoint fornece informações sobre a estrutura da página da web, incluindo contagens de links, imagens, cabeçalhos e parágrafos, bem como o conteúdo HTML em si e detalhes da resposta HTTP

Os usuários podem personalizar solicitações especificando diferentes URLs para extrair HTML de várias páginas A API lida automaticamente com a busca e o processamento da URL fornecida

Por exemplo, `link_count` indica o número de hyperlinks na página, enquanto `heading_tag_count` fornece uma distribuição dos diferentes níveis de cabeçalho (h1, h2, etc.), ajudando os usuários a entender a hierarquia de conteúdo da página

A API busca dados ao vivo diretamente dos URLs especificados, garantindo que o HTML e os metadados reflitam o estado atual da página da web, sujeito à disponibilidade do site

Os casos de uso típicos incluem raspagem de dados para análise de dados auditorias de SEO para avaliar elementos na página monitoramento de conteúdo para mudanças e construção de ferramentas para mecanismos de busca ou crawlers

Casos de uso típicos incluem raspagem de dados para análise de dados auditorias de SEO para otimização de conteúdo e construção de crawlers ou mecanismos de busca que exigem dados HTML estruturados para processamento

Perguntas Frequentes Gerais

O Zyla API Hub é como uma grande loja de APIs, onde você pode encontrar milhares delas em um só lugar. Também oferecemos suporte dedicado e monitoramento em tempo real de todas as APIs. Após se cadastrar, você pode escolher quais APIs deseja usar. Lembre-se apenas de que cada API precisa de sua própria assinatura. Mas se você se inscrever em várias, usará a mesma chave para todas elas, facilitando as coisas para você.

Os preços são listados em USD (Dólar Americano), EUR (Euro), CAD (Dólar Canadense), AUD (Dólar Australiano) e GBP (Libra Esterlina). Aceitamos todos os principais cartões de débito e crédito. Nosso sistema de pagamento usa a mais recente tecnologia de segurança e é operado pela Stripe, uma das empresas de pagamento mais confiáveis do mundo. Se tiver problemas para pagar com cartão, entre em contato conosco em [email protected]


Além disso, se você já tiver uma assinatura ativa em qualquer uma dessas moedas (USD, EUR, CAD, AUD, GBP), essa moeda será mantida para assinaturas subsequentes. Você pode alterar a moeda a qualquer momento, desde que não tenha assinaturas ativas.

A moeda local exibida na página de preços é baseada no país do seu endereço IP e é fornecida apenas como referência. Os preços reais são em USD (Dólar Americano). Ao efetuar o pagamento, a cobrança aparecerá no extrato do seu cartão em USD, mesmo que você veja o valor equivalente em sua moeda local em nosso site. Isso significa que você não pode pagar diretamente com sua moeda local.

Ocasionalmente, o banco pode recusar a cobrança devido às configurações de proteção contra fraude. Sugerimos contatar seu banco inicialmente para verificar se estão bloqueando nossas cobranças. Você também pode acessar o Portal de Cobrança e alterar o cartão associado para realizar o pagamento. Se isso não funcionar e precisar de mais ajuda, entre em contato com nossa equipe em [email protected]

Os preços são determinados por uma assinatura recorrente mensal ou anual, dependendo do plano escolhido.

As chamadas de API são descontadas do seu plano com base nas requisições bem-sucedidas. Cada plano possui um número específico de chamadas por mês. Apenas chamadas bem-sucedidas, indicadas por uma resposta com Status 200, serão contabilizadas, garantindo que falhas não afetem sua cota mensal.

O Zyla API Hub funciona com um sistema de assinatura mensal recorrente. Seu ciclo de cobrança começa no dia em que você compra um dos planos pagos e será renovado no mesmo dia do mês seguinte. Portanto, cancele sua assinatura com antecedência se quiser evitar cobranças futuras.

Para fazer upgrade do seu plano atual, acesse a página de preços da API e selecione o novo plano desejado. O upgrade é instantâneo, permitindo aproveitar imediatamente os recursos do novo plano. Observe que as chamadas restantes do plano anterior não serão transferidas; você será cobrado pelo valor integral do novo plano.

Para verificar quantas chamadas de API restam para o mês atual, consulte o campo 'X-Zyla-API-Calls-Monthly-Remaining' no cabeçalho da resposta. Por exemplo, se seu plano permite 1.000 requisições por mês e você usou 100, este campo no cabeçalho da resposta indicará 900 chamadas restantes.

Para ver o número máximo de requisições de API que seu plano permite, verifique o cabeçalho de resposta 'X-Zyla-RateLimit-Limit'. Por exemplo, se seu plano inclui 1.000 requisições por mês, este cabeçalho exibirá 1.000.

O cabeçalho 'X-Zyla-RateLimit-Reset' mostra o número de segundos até seu limite de taxa ser redefinido. Isso informa quando sua contagem de requisições começará do zero. Por exemplo, se exibir 3.600, significa que restam 3.600 segundos até o limite ser redefinido.

Sim, você pode cancelar seu plano a qualquer momento acessando sua conta e selecionando a opção de cancelamento na página de Cobrança. Observe que upgrades, downgrades e cancelamentos têm efeito imediato. Além disso, após o cancelamento, você não terá mais acesso ao serviço, mesmo que ainda tenha chamadas restantes na sua cota.

Você pode nos contatar via chat para receber assistência imediata. Estamos online de 8h às 17h (EST). Se nos contatar após esse horário, retornaremos o mais rápido possível. Além disso, você pode enviar um e-mail para [email protected]

Para oferecer a oportunidade de experimentar nossas APIs sem compromisso, oferecemos um teste gratuito de 7 dias que permite realizar até 50 chamadas de API sem custo. Esse teste pode ser usado apenas uma vez; recomendamos aplicá-lo à API que mais interessa. Embora a maioria das APIs ofereça teste gratuito, algumas podem não oferecer. O teste termina após 7 dias ou quando você atingir 50 requisições, o que ocorrer primeiro. Se atingir o limite, será necessário "Iniciar seu plano pago" para continuar. Você encontra esse botão no perfil em Assinatura -> Escolha a API -> aba Preços. Se não cancelar até o 7º dia, sua assinatura será cobrada automaticamente, liberando todas as chamadas do plano.

Após 7 dias, será cobrado o valor total do plano ao qual você estava inscrito durante o teste. Portanto, é importante cancelar antes do término do período. Solicitações de reembolso por esquecimento de cancelamento não são aceitas.

Ao assinar um teste gratuito de API, você pode fazer até 50 chamadas. Se desejar fazer chamadas adicionais além desse limite, a API solicitará que você "Inicie seu plano pago". Você encontra o botão no perfil em Assinatura -> Escolha a API -> aba Preços.

As Ordens de Pagamento são processadas entre os dias 20 e 30 de cada mês. Se você enviar sua solicitação antes do dia 20, seu pagamento será processado dentro desse período.


APIs relacionadas


Você também pode gostar