Doc para Texto API

Desbloqueie o poder dos dados com a API DocToText sua solução definitiva para conversão de documentos sem costura De DOC e PDF a imagens e e-mails transforme diversos formatos em texto simples e HTML sem esforço Seja uma tarefa pequena ou um projeto em larga escala experimente capacidades de OCR e análise de e-mails de primeira linha Simplifique sua jornada de extração de dados hoje
Use esta API do seu agente de IA via MCP
Funciona com OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline e qualquer cliente de IA compatível com MCP.
Docs e configuração
Crie uma skill envolvendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

Sobre a API:  

 

Potencialize sua Jornada de Dados com a API DocToText

A API DocToText é a pedra angular da extração eficiente de dados, adaptada tanto para pequenas tarefas quanto para projetos de grande escala. Esta ferramenta versátil converte perfeitamente uma ampla variedade de formatos, incluindo DOC, XLS, PPT, PDF, vários formatos de email e imagens, em texto simples e HTML.

Capacidades Avançadas de Extração de Dados:

No coração da API DocToText reside sua tecnologia OCR de ponta. Seja lidando com documentos digitalizados, imagens ou PDFs complexos, seu OCR de alta qualidade, programável e treinável, garante extração de texto precisa e confiável. Isso é complementado por robustas capacidades de análise de emails, permitindo o processamento sem interrupções de EML, PST, OST e outros formatos de email.

Suporte Abrangente a Formatos:

A API DocToText suporta uma impressionante variedade de formatos, desde arquivos de escritório comuns como DOCX e XLSX até formatos especializados como iWork (PAGES, NUMBERS, KEYNOTE) e Outlook (PST, OST). Sua flexibilidade se estende a formatos de imagem como JPG, PNG e TIFF, permitindo a extração de várias fontes.

Integração Sem Costura para Cada Projeto:

Seja você gerenciando uma aplicação empresarial intensiva em dados, conduzindo pesquisas ou automatizando tarefas de escritório rotineiras, a API DocToText se integra sem esforço ao seu fluxo de trabalho. Sua adaptabilidade permite fácil incorporação em diversas plataformas, garantindo processamento de dados suave sem interromper seus sistemas existentes.

Personalizável e Escalável:

As capacidades de OCR programável e treinável da API DocToText permitem personalização para requisitos específicos do projeto. Ela escala perfeitamente, acomodando tanto tarefas de pequena escala quanto projetos de extração de dados de alto volume. Sua robustez garante precisão e consistência, mesmo em ambientes exigentes.

Confiável e Pronto para o Futuro:

A API DocToText não apenas atende às suas necessidades atuais, mas também está pronta para o futuro, acomodando formatos e tecnologias emergentes. Suas atualizações e melhorias contínuas garantem que você esteja sempre equipado com as ferramentas mais recentes para a extração eficiente de dados, tornando-a um ativo indispensável para empresas e desenvolvedores. Simplifique seus desafios de extração de dados com a API DocToText, sua chave para soluções de extração de texto precisas, confiáveis e escaláveis.

 

O que esta API recebe e o que sua API fornece (entrada/saída)?

Envie qualquer documento de sua escolha e receba o texto reconhecido. 

Formatos: DOC, XLS, XLSB, PPT, RTF, ODF (ODT, ODS, ODP), OOXML (DOCX, XLSX, PPTX), iWork (PAGES, NUMBERS, KEYNOTE), ODFXML (FODP, FODS, FODT), PDF, EML, HTML, Outlook (PST, OST), Imagem (JPG, JPEG, JFIF, BMP, PNM, PNG, TIFF, WEBP)

 

Quais são os casos de uso mais comuns desta API?

  1. Arquivamento Digital e Gestão de Documentos: Empresas e organizações podem usar a API DocToText para converter grandes volumes de documentos, incluindo imagens digitalizadas e PDFs, em texto pesquisável e editável. Isso facilita o arquivamento digital eficiente e a gestão de documentos, permitindo fácil recuperação e edição da informação. Bibliotecas, sociedades históricas e organizações governamentais podem digitalizar documentos históricos para fins de preservação e pesquisa.

  2. Inteligência de Negócios e Análise de Dados: Empresas podem empregar a API DocToText para extrair dados textuais de vários relatórios, faturas e documentos financeiros. Ao converter esses dados em formatos estruturados, como CSV ou JSON, as empresas podem realizar análises de dados aprofundadas. Este caso de uso é particularmente valioso para instituições financeiras, empresas de pesquisa de mercado e plataformas de e-commerce, ajudando-as a obter percepções valiosas a partir de dados textuais.

  3. Agregação e Análise de Conteúdo: Empresas de monitoramento de mídia, agências de notícias e agregadores de conteúdo podem utilizar a API DocToText para extrair texto de artigos, blogs e postagens em redes sociais. Ao converter esses dados não estruturados em texto legível, essas organizações podem automatizar o processo de agregação de conteúdo. Algoritmos de Processamento de Linguagem Natural (PLN) podem então ser aplicados para análise de sentimento, modelagem de tópicos e outras formas de análise de conteúdo.

  4. Atendimento ao Cliente e Serviços Automatizados: Empresas com grandes volumes de interações com clientes, como emails e tickets de suporte, podem se beneficiar da API DocToText. Ao converter consultas e feedback de clientes em texto simples, as empresas podem empregar chatbots e sistemas automatizados para fornecer respostas rápidas e precisas. Isso não apenas melhora a satisfação do cliente ao fornecer suporte oportuno, mas também reduz a carga de trabalho dos agentes de suporte ao cliente humanos.

  5. Enriquecimento de Dados para Modelos de Aprendizado de Máquina: Desenvolvedores de aprendizado de máquina e cientistas de dados podem usar a API DocToText para processar dados textuais para treinamento de modelos de aprendizado de máquina. Ao converter documentos em texto simples, esta API garante que os dados estejam em um formato consistente, prontos para extração de características e treinamento de modelos. Este caso de uso é crucial em várias aplicações, incluindo análise de sentimento, tradução de língua e resumo de textos.

 

Existem limitações em seus planos?

Além do número de chamadas de API disponíveis para o plano, não há outras limitações.

Documentação da API

Endpoints


Enviar arquivo para extração

Os formatos incluem:

DOC XLS XLSB PPT RTF ODF (ODT ODS ODP)
OOXML (DOCX XLSX PPTX) iWork (PAGES NUMBERS KEYNOTE)
ODFXML (FODP FODS FODT) PDF EML HTML Outlook (PST OST)
Imagem (JPG JPEG JFIF BMP PNM PNG TIFF WEBP)



                                                                            
POST https://www.zylalabs.com/api/2677/doc+to+text+api/2781/extract+text
                                                                            
                                                                        

Extrair Texto - Recursos do endpoint

Objeto Descrição
Corpo da requisição [Obrigatório] Arquivo binário
Testar endpoint

RESPOSTA DE EXEMPLO DA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        

IP Address Classes Range:

Class                           IP Address Range (Theoretical)  Application / Used for        
A                               0.0.0.0 to 127.255.255.255      Very large networks           
B                               128.0.0.0 to 191.255.255.255    Medium networks               
C                               192.0.0.0 to 223.255.255.255    Small networks                
D                               224.0.0.0 to 239.255.255.255    Multicast                     



                                                                                                                                                                                                                    
                                                                                                    

Extrair Texto - TRECHOS DE CÓDIGO


    curl --location 'https://zylalabs.com/api/2677/doc+to+text+api/2781/extract+text' \
    --header 'Content-Type: application/json' \ 
    --form 'image=@"FILE_PATH"'


Chave de acesso à API e autenticação

Após se cadastrar, cada desenvolvedor recebe uma chave de acesso à API pessoal, uma combinação única de letras e dígitos para acessar nosso endpoint de API. Para autenticar com a Doc para Texto API basta incluir seu token Bearer no cabeçalho Authorization.
Cabeçalhos
Cabeçalho Descrição
Authorization [Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito.

Preços simples e transparentes

Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.

🚀 Empresarial

A partir de
$ 10.000/Ano


  • Volume personalizado
  • Limite de taxa personalizado
  • Suporte ao cliente especializado
  • Monitoramento de API em tempo real

Recursos favoritos dos clientes

  • ✔︎ Pague apenas por requisições bem-sucedidas
  • ✔︎ Teste 7 dias gratis
  • ✔︎ Suporte multilíngue
  • ✔︎ Uma chave de API, todas as APIs.
  • ✔︎ Painel intuitivo
  • ✔︎ Tratamento de erros abrangente
  • ✔︎ Documentação amigável para desenvolvedores
  • ✔︎ Integração com Postman
  • ✔︎ Conexões HTTPS seguras
  • ✔︎ Alta disponibilidade

Doc para Texto API FAQs

A API DocToText é uma ferramenta de extração de dados que converte uma variedade de formatos de documentos, incluindo DOC, PDF, imagens e emails, em texto simples e HTML. Ela utiliza avançadas capacidades de OCR e análise de emails para extrair texto de documentos e emails digitalizados, tornando o conteúdo facilmente acessível para processamento posterior

A API DocToText suporta uma ampla variedade de formatos, incluindo DOC, XLS, PPT, PDF, vários formatos de email (EML, PST, OST) e formatos de imagem (JPG, PNG, TIFF). Ela também lida com formatos especializados como iWork (PAGES, NUMBERS, KEYNOTE) e Outlook (PST, OST), garantindo compatibilidade com diversas fontes de dados

A tecnologia OCR integrada à API DocToText é de alta qualidade. Ela foi projetada para reconhecer com precisão o texto de documentos digitalizados imagens e PDFs garantindo extração confiável mesmo de fontes de entrada complexas ou de baixa qualidade

Sim a API DocToText é bem adequada tanto para pequenas tarefas quanto para projetos de extração de dados em larga escala Sua escalabilidade permite processar eficientemente altos volumes de documentos tornando-a ideal para aplicações que requerem extração extensiva de dados

A funcionalidade principal da API DocToText é extrair texto simples e HTML de documentos Enquanto foca no conteúdo textual pode não reter formatação intricada ou imagens durante o processo de conversão

A API DocToText retorna texto extraído em formatos de texto simples e HTML Isso inclui texto reconhecido de vários tipos de documentos, como DOC, PDF e imagens, permitindo que os usuários acessem e manipulem o conteúdo facilmente

Os dados de resposta incluem principalmente o conteúdo de texto extraído. Dependendo do tipo de documento, também podem conter metadados como o nome do arquivo original, formato e qualquer informação de processamento relevante

Os dados de resposta estão estruturados em um formato JSON tipicamente contendo campos para o texto extraído, metadados do arquivo e quaisquer mensagens de erro se aplicável. Esta organização permite uma fácil análise e integração em aplicações

O endpoint aceita parâmetros como o arquivo do documento (em formatos suportados) e configurações opcionais para personalização de OCR, como seleção de idioma ou opções de extração específicas para melhorar a precisão

Os usuários podem personalizar solicitações especificando parâmetros como o formato de saída desejado (texto simples ou HTML) e selecionando configurações de OCR, como idioma ou preferências de extração, para adaptar os resultados às suas necessidades

A API fornece acesso a dados textuais extraídos de documentos incluindo imagens digitalizadas e-mails e vários formatos de arquivo Isso permite que os usuários recuperem informações para arquivamento digital análise de dados e agregação de conteúdo

A precisão dos dados é mantida por meio de tecnologia OCR avançada que é scriptável e treinável Atualizações e melhorias contínuas garantem que a API se adapte a novos formatos e melhore a confiabilidade da extração ao longo do tempo

Casos de uso típicos incluem arquivamento digital de documentos, análise de dados para inteligência de negócios, agregação de conteúdo para monitoramento de mídia e pré-processamento de texto para aplicações de aprendizado de máquina, melhorando a acessibilidade e usabilidade dos dados

Perguntas Frequentes Gerais

O Zyla API Hub é como uma grande loja de APIs, onde você pode encontrar milhares delas em um só lugar. Também oferecemos suporte dedicado e monitoramento em tempo real de todas as APIs. Após se cadastrar, você pode escolher quais APIs deseja usar. Lembre-se apenas de que cada API precisa de sua própria assinatura. Mas se você se inscrever em várias, usará a mesma chave para todas elas, facilitando as coisas para você.

Os preços são listados em USD (Dólar Americano), EUR (Euro), CAD (Dólar Canadense), AUD (Dólar Australiano) e GBP (Libra Esterlina). Aceitamos todos os principais cartões de débito e crédito. Nosso sistema de pagamento usa a mais recente tecnologia de segurança e é operado pela Stripe, uma das empresas de pagamento mais confiáveis do mundo. Se tiver problemas para pagar com cartão, entre em contato conosco em [email protected]


Além disso, se você já tiver uma assinatura ativa em qualquer uma dessas moedas (USD, EUR, CAD, AUD, GBP), essa moeda será mantida para assinaturas subsequentes. Você pode alterar a moeda a qualquer momento, desde que não tenha assinaturas ativas.

A moeda local exibida na página de preços é baseada no país do seu endereço IP e é fornecida apenas como referência. Os preços reais são em USD (Dólar Americano). Ao efetuar o pagamento, a cobrança aparecerá no extrato do seu cartão em USD, mesmo que você veja o valor equivalente em sua moeda local em nosso site. Isso significa que você não pode pagar diretamente com sua moeda local.

Ocasionalmente, o banco pode recusar a cobrança devido às configurações de proteção contra fraude. Sugerimos contatar seu banco inicialmente para verificar se estão bloqueando nossas cobranças. Você também pode acessar o Portal de Cobrança e alterar o cartão associado para realizar o pagamento. Se isso não funcionar e precisar de mais ajuda, entre em contato com nossa equipe em [email protected]

Os preços são determinados por uma assinatura recorrente mensal ou anual, dependendo do plano escolhido.

As chamadas de API são descontadas do seu plano com base nas requisições bem-sucedidas. Cada plano possui um número específico de chamadas por mês. Apenas chamadas bem-sucedidas, indicadas por uma resposta com Status 200, serão contabilizadas, garantindo que falhas não afetem sua cota mensal.

O Zyla API Hub funciona com um sistema de assinatura mensal recorrente. Seu ciclo de cobrança começa no dia em que você compra um dos planos pagos e será renovado no mesmo dia do mês seguinte. Portanto, cancele sua assinatura com antecedência se quiser evitar cobranças futuras.

Para fazer upgrade do seu plano atual, acesse a página de preços da API e selecione o novo plano desejado. O upgrade é instantâneo, permitindo aproveitar imediatamente os recursos do novo plano. Observe que as chamadas restantes do plano anterior não serão transferidas; você será cobrado pelo valor integral do novo plano.

Para verificar quantas chamadas de API restam para o mês atual, consulte o campo 'X-Zyla-API-Calls-Monthly-Remaining' no cabeçalho da resposta. Por exemplo, se seu plano permite 1.000 requisições por mês e você usou 100, este campo no cabeçalho da resposta indicará 900 chamadas restantes.

Para ver o número máximo de requisições de API que seu plano permite, verifique o cabeçalho de resposta 'X-Zyla-RateLimit-Limit'. Por exemplo, se seu plano inclui 1.000 requisições por mês, este cabeçalho exibirá 1.000.

O cabeçalho 'X-Zyla-RateLimit-Reset' mostra o número de segundos até seu limite de taxa ser redefinido. Isso informa quando sua contagem de requisições começará do zero. Por exemplo, se exibir 3.600, significa que restam 3.600 segundos até o limite ser redefinido.

Sim, você pode cancelar seu plano a qualquer momento acessando sua conta e selecionando a opção de cancelamento na página de Cobrança. Observe que upgrades, downgrades e cancelamentos têm efeito imediato. Além disso, após o cancelamento, você não terá mais acesso ao serviço, mesmo que ainda tenha chamadas restantes na sua cota.

Você pode nos contatar via chat para receber assistência imediata. Estamos online de 8h às 17h (EST). Se nos contatar após esse horário, retornaremos o mais rápido possível. Além disso, você pode enviar um e-mail para [email protected]

Para oferecer a oportunidade de experimentar nossas APIs sem compromisso, oferecemos um teste gratuito de 7 dias que permite realizar até 50 chamadas de API sem custo. Esse teste pode ser usado apenas uma vez; recomendamos aplicá-lo à API que mais interessa. Embora a maioria das APIs ofereça teste gratuito, algumas podem não oferecer. O teste termina após 7 dias ou quando você atingir 50 requisições, o que ocorrer primeiro. Se atingir o limite, será necessário "Iniciar seu plano pago" para continuar. Você encontra esse botão no perfil em Assinatura -> Escolha a API -> aba Preços. Se não cancelar até o 7º dia, sua assinatura será cobrada automaticamente, liberando todas as chamadas do plano.

Após 7 dias, será cobrado o valor total do plano ao qual você estava inscrito durante o teste. Portanto, é importante cancelar antes do término do período. Solicitações de reembolso por esquecimento de cancelamento não são aceitas.

Ao assinar um teste gratuito de API, você pode fazer até 50 chamadas. Se desejar fazer chamadas adicionais além desse limite, a API solicitará que você "Inicie seu plano pago". Você encontra o botão no perfil em Assinatura -> Escolha a API -> aba Preços.

As Ordens de Pagamento são processadas entre os dias 20 e 30 de cada mês. Se você enviar sua solicitação antes do dia 20, seu pagamento será processado dentro desse período.


APIs relacionadas


Você também pode gostar