Extracción de Datos del Documento API

Optimiza tus flujos de trabajo con nuestra API de Extracción de Datos de Documentos, diseñada para transformar cualquier documento estructurado o no estructurado en datos estructurados y procesables.
Usa esta API desde tu agente de IA vía MCP
Funciona con OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline y cualquier cliente de IA compatible con MCP.
Docs y configuración
Crea un skill envolviendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

Eleva tus capacidades de manejo de datos con la API de Extracción de Datos de Documentos de Extracta.ai. Nuestra solución de vanguardia permite a tus sistemas extraer automáticamente datos estructurados de una multitud de documentos, ya sean imágenes escaneadas, PDFs, correos electrónicos, facturas, contratos o cualquier formato de archivo digital que puedas imaginar. Diseñada para satisfacer las necesidades de diversas industrias, nuestra API facilita la automatización sin esfuerzo de los flujos de trabajo, reduciendo significativamente los esfuerzos manuales y mejorando la eficiencia general.

Características:

  • Compatibilidad Universal: Procesa documentos en cualquier formato: PDF, DOCX, TXT, JPG, PNG, y más.
  • Alta Precisión y Velocidad: Aprovecha la tecnología de última generación que no requiere preentrenamiento, asegurando una extracción rápida con una precisión superior.
  • Extracción de Datos Personalizada: Define criterios de extracción específicos para satisfacer tus necesidades comerciales únicas, desde la extracción de secciones de texto específicas hasta puntos de datos complejos.
  • Fácil Integración: Con documentación de API amigable para desarrolladores, integra nuestro servicio sin problemas en tu software o flujo de trabajo existente.
  • Escalabilidad: Desde unos pocos documentos hasta miles, nuestra API puede manejar lotes de cualquier tamaño de manera eficiente.
  • Seguridad: La privacidad y seguridad de tus datos son primordiales. Nos aseguramos de que tu información nunca se utilice con fines de entrenamiento y se maneje con la máxima confidencialidad.

 

Ya seas un desarrollador de software, un analista de negocios o un científico de datos, nuestra API de Extracción de Datos de Documentos está diseñada para simplificar tus tareas de procesamiento de datos, permitiéndote centrarte en lo que realmente importa: impulsar tu negocio hacia adelante. Comienza con Extracta.ai hoy y transforma la forma en que manejas documentos para siempre.

Documentación de la API

Endpoints


Estructura tu solicitud con parámetros obligatorios: 'name', 'language', 'fields' y 'file'. Cada campo requiere una 'key', siendo 'description' y 'example' opcionales. El documento debe proporcionarse como 'base64String' o una 'fileUrl'.

## Documentación de la API
Esta sección proporciona directrices para estructurar tus solicitudes a la API de Análisis de Documentos de Extracta.ai. Asegúrate de seguir el formato a continuación para una extracción de datos exitosa:

## Formato de Solicitud
```
{
"extractionDetails": {
"name": "Nombre de la Extracción", // obligatorio - Nombra tu proceso de extracción
"language": "Idioma Soportado", // obligatorio - Elige de los idiomas soportados
"fields": [
{
"key": "Clave del Campo", // obligatorio - Define la clave para la extracción de datos
"description": "Descripción del Campo", // opcional - Describe el campo
"example": "Ejemplo del Campo" // opcional - Proporciona un valor de ejemplo
},
...
]
},
"file": "base64String o URL del archivo" // obligatorio - Proporciona el documento en formato base64String o como una URL
}
```
## Formato Avanzado
Además del formato básico descrito en las secciones anteriores, Extracta.ai también soporta estructuras de datos más complejas para necesidades de extracción especializadas. Este formato avanzado permite la definición de **objetos y arreglos anidados**, atendiendo a un rango más amplio de representación de datos.

### Tipo `object`
El tipo **object** representa un objeto estructurado con múltiples **propiedades**. Cada propiedad se define como un objeto dentro de un arreglo, y puede incluir su propia **key**, **description**, **type** y **example**.
```
{
"key": "informacion_personal",
"description": "Información personal de la persona", // opcional
"type": "object",
"properties": [
{
"key": "name",
"description": "Nombre de la persona", // opcional
"example": "Alex Smith", // opcional
"type": "string" // opcional
},
{
"key": "email",
"description": "Email de la persona",
"example": "[email protected]",
"type": "string"
},
.....
]
}
```

### Tipo `array`
El tipo **array** se utiliza para listas de **elementos**, como una colección de experiencias laborales. La clave items contiene un objeto que define la estructura de cada elemento en el arreglo.
```
{
"key": "experiencia_laboral",
"description": "Experiencia laboral de la persona", // opcional
"type": "array",
"items": {
"type": "object",
"properties": [
{
"key": "title",
"description": "Título del trabajo", // opcional
"example": "Ingeniero de Software", // opcional
"type": "string" // opcional
},
{
"key": "start_date",
"description": "Fecha de inicio del trabajo",
"example": "2022",
"type": "string"
},
...
]
}
}
```

### Notas sobre el Uso | API de Análisis de Documentos
- Para los tipos `object` y `array`, el parámetro `example` es aplicable solo para sus propiedades/items internas.
- Al definir campos, si no se especifica un `type`, por defecto es `string`.
- Para los tipos `object` y `array`, los campos internos solo pueden ser de tipo `string`. Esto significa que cada propiedad dentro de un objeto o cada elemento dentro de un arreglo debe ser de tipo string, asegurando consistencia y simplicidad en la representación de datos.
- Estos tipos de campo avanzados permiten una representación de datos más detallada y estructurada, mejorando las capacidades del proceso de extracción de datos de Extracta.ai.

## Tipos de Archivo Soportados

Extracta.ai es capaz de procesar documentos en **formatos de imagen (JPG, PNG), PDF y DOCX**. Esta mejora permite una gama más amplia de tipos de documentos para ser enviados para extracción.

## Idiomas Soportados

Extracta.ai actualmente soporta la extracción de documentos en los siguientes idiomas: **Rumano, Inglés, Francés, Español, Árabe, Portugués, Alemán, Italiano**. Se planea soporte adicional para 20 idiomas más.

**Nota**: Si se especifica un idioma no soportado, la API devolverá un mensaje de error indicando una elección de idioma inválida. Mantente actualizado con nuestra documentación de API para nuevas adiciones de idiomas.



                                                                            
POST https://www.zylalabs.com/api/3606/document+data+extraction+api/4000/process+document
                                                                            
                                                                        

Documento de Proceso - Características del Endpoint

Objeto Descripción
Cuerpo de la Solicitud [Requerido] Json
Probar Endpoint

RESPUESTA DE EJEMPLO DE LA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {
	"name": "Darren Charles",
	"email": "[email protected]",
	"phone": "+1-709-680-9033",
	"address": "9 Corpus Christi, Texas",
	"soft_skills": "highly motivated, ability to translate business strategies, learn new things",
	"hard_skills": "Matlab, MeVisLab, Keras, CUDA, Git, DataStage, MQTT",
	"last_job": "Trainee With English Communications",
	"years_of_experience": "Ongoing"
}
                                                                                                                                                                                                                    
                                                                                                    

Documento de Proceso - CÓDIGOS DE EJEMPLO


curl --location --request POST 'https://zylalabs.com/api/3606/document+data+extraction+api/4000/process+document' --header 'Authorization: Bearer YOUR_API_KEY' 

--data-raw '{
	"extractionDetails": {
		"name": "CV - Extraction",
		"language": "English",
		"fields": [
			{
				"key": "name",
				"description": "the name of the person in the CV",
				"example": "Johan Smith"
			},
			{
				"key": "email",
				"description": "the email of the person in the CV",
				"example": "[email protected]"
			},
			{
				"key": "phone",
				"description": "the phone number of the person",
				"example": "123 333 4445"
			},
			{
				"key": "address",
				"description": "the compelte address of the person",
				"example": "1234 Main St, New York, NY 10001"
			},
			{
				"key": "soft_skills",
				"description": "the soft skills of the person",
				"example": ""
			},
			{
				"key": "hard_skills",
				"description": "the hard skills of the person",
				"example": ""
			},
			{
				"key": "last_job",
				"description": "the last job of the person",
				"example": "Software Engineer"
			},
			{
				"key": "years_of_experience",
				"description": "the years of experience of last job",
				"example": "5"
			}
		]
	},
	"file": "https://deveatery.com/extracta/cv.png"
}'

    

Clave de Acceso a la API y Autenticación

Después de registrarte, a cada desarrollador se le asigna una clave de acceso a la API personal, una combinación única de letras y dígitos proporcionada para acceder a nuestro endpoint de la API. Para autenticarte con el Extracción de Datos del Documento API simplemente incluye tu token de portador en el encabezado de Autorización.
Encabezados
Encabezado Descripción
Autorización [Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito.

Precios Simples y Transparentes

Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.

🚀 PLAN CORPORATIVO A MEDIDA

Comienza en
$ 10.000/Año


  • Volumen Personalizado
  • Límite de solicitudes personalizado
  • Soporte al Cliente Especializado
  • Monitoreo de API en Tiempo Real

Funciones favoritas de los clientes

  • ✔︎ Paga Solo por Solicitudes Exitosas
  • ✔︎ Prueba 7 días gratis
  • ✔︎ Soporte Multilenguaje
  • ✔︎ Una Clave API, Todas las APIs.
  • ✔︎ Panel de Control Intuitivo
  • ✔︎ Manejo de Errores Integral
  • ✔︎ Documentación Amigable para Desarrolladores
  • ✔︎ Integración con Postman
  • ✔︎ Conexiones HTTPS Seguras
  • ✔︎ Tiempo de Actividad Fiable

Extracción de Datos del Documento API FAQs

Somos capaces de manejar un amplio espectro de documentos, que abarcan tanto formatos estructurados como no estructurados, como PDFs, documentos de Word, archivos de texto e imágenes escaneadas (en formatos PNG, JPG), utilizando tecnología OCR según sea necesario.

La API devuelve datos estructurados extraídos de documentos, incluidos campos clave como nombre, correo electrónico, teléfono, dirección y habilidades. Estos datos están organizados en un formato JSON, lo que facilita su integración en aplicaciones.

Los usuarios pueden personalizar las solicitudes definiendo criterios de extracción específicos en el parámetro 'fields'. Cada campo puede incluir una 'clave', 'descripción' y 'ejemplo', lo que permite una extracción de datos adaptada a las necesidades comerciales únicas.

Los datos de respuesta suelen incluir campos como "nombre", "correo electrónico", "teléfono", "dirección", "habilidades blandas", "habilidades duras", "último trabajo" y "años de experiencia". Estos campos proporcionan información completa sobre el contenido del documento extraído.

Los datos de respuesta están estructurados en un formato JSON, donde cada clave corresponde a una pieza específica de información extraída. Esta organización permite un análisis e integración sencillos en varias aplicaciones.

La API puede extraer una amplia gama de información, incluyendo detalles personales, información de contacto, habilidades, experiencia laboral y antecedentes educativos de varios tipos de documentos, como currículos e facturas.

La precisión de los datos se mantiene a través de algoritmos de extracción avanzados que aprovechan la tecnología de vanguardia. La API no requiere preentrenamiento, lo que garantiza una extracción rápida y precisa de diversos formatos de documentos.

El endpoint acepta parámetros como 'name' (nombre de la extracción), 'language' (idiomas soportados) y 'fields' (claves de datos específicas). Los usuarios deben proporcionar un documento válido en formato 'base64String' o 'fileUrl'.

Los casos de uso típicos incluyen la automatización de la entrada de datos a partir de currículos, facturas, contratos y otros documentos, la optimización de flujos de trabajo en los sectores de recursos humanos, finanzas y legal, y la mejora de la eficiencia en el procesamiento de datos en diversas industrias.

General FAQs

Zyla API Hub es como una gran tienda de APIs, donde puedes encontrar miles de ellas en un solo lugar. También ofrecemos soporte dedicado y monitoreo en tiempo real de todas las APIs. Una vez que te registres, puedes elegir qué APIs quieres usar. Solo recuerda que cada API necesita su propia suscripción. Pero si te suscribes a varias, usarás la misma clave para todas, lo que hace todo más fácil para ti.

Los precios se muestran en USD (dólar estadounidense), EUR (euro), CAD (dólar canadiense), AUD (dólar australiano) y GBP (libra esterlina). Aceptamos todas las principales tarjetas de débito y crédito. Nuestro sistema de pago utiliza la última tecnología de seguridad y está respaldado por Stripe, una de las compañías de pago más confiables del mundo. Si tienes algún problema para pagar con tarjeta, contáctanos en [email protected]


Además, si ya tienes una suscripción activa en cualquiera de estas monedas (USD, EUR, CAD, AUD, GBP), esa moneda se mantendrá para suscripciones posteriores. Puedes cambiar la moneda en cualquier momento siempre que no tengas suscripciones activas.

La moneda local que aparece en la página de precios se basa en el país de tu dirección IP y se proporciona solo como referencia. Los precios reales están en USD (dólar estadounidense). Cuando realices un pago, el cargo aparecerá en tu estado de cuenta en USD, incluso si ves el monto equivalente en tu moneda local en nuestro sitio web. Esto significa que no puedes pagar directamente en tu moneda local.

Ocasionalmente, un banco puede rechazar el cargo debido a sus configuraciones de protección contra fraude. Te sugerimos comunicarte con tu banco primero para verificar si están bloqueando nuestros cargos. También puedes acceder al Portal de Facturación y cambiar la tarjeta asociada para realizar el pago. Si esto no funciona y necesitas más ayuda, por favor contacta a nuestro equipo en [email protected]

Los precios se determinan mediante una suscripción recurrente mensual o anual, dependiendo del plan elegido.

Las llamadas a la API se descuentan de tu plan en base a solicitudes exitosas. Cada plan incluye una cantidad específica de llamadas que puedes realizar por mes. Solo las llamadas exitosas, indicadas por una respuesta con estado 200, se contarán en tu total. Esto asegura que las solicitudes fallidas o incompletas no afecten tu cuota mensual.

Zyla API Hub funciona con un sistema de suscripción mensual recurrente. Tu ciclo de facturación comenzará el día en que compres uno de los planes de pago, y se renovará el mismo día del mes siguiente. Así que recuerda cancelar tu suscripción antes si quieres evitar futuros cargos.

Para actualizar tu plan de suscripción actual, simplemente ve a la página de precios de la API y selecciona el plan al que deseas actualizarte. La actualización será instantánea, permitiéndote disfrutar inmediatamente de las funciones del nuevo plan. Ten en cuenta que las llamadas restantes de tu plan anterior no se transferirán al nuevo plan, por lo que debes considerar esto al actualizar. Se te cobrará el monto total del nuevo plan.

Para verificar cuántas llamadas a la API te quedan en el mes actual, revisa el campo 'X-Zyla-API-Calls-Monthly-Remaining' en el encabezado de la respuesta. Por ejemplo, si tu plan permite 1,000 solicitudes por mes y has usado 100, este campo mostrará 900 llamadas restantes.

Para ver el número máximo de solicitudes a la API que permite tu plan, revisa el encabezado de la respuesta 'X-Zyla-RateLimit-Limit'. Por ejemplo, si tu plan incluye 1,000 solicitudes por mes, este encabezado mostrará 1,000.

El encabezado 'X-Zyla-RateLimit-Reset' muestra el número de segundos hasta que tu límite se restablezca. Esto te indica cuándo tu conteo de solicitudes se reiniciará. Por ejemplo, si muestra 3,600, significa que faltan 3,600 segundos para que el límite se restablezca.

Sí, puedes cancelar tu plan en cualquier momento desde tu cuenta, seleccionando la opción de cancelación en la página de Facturación. Ten en cuenta que las actualizaciones, degradaciones y cancelaciones tienen efecto inmediato. Además, al cancelar ya no tendrás acceso al servicio, incluso si te quedaban llamadas en tu cuota.

Puedes contactarnos a través de nuestro canal de chat para recibir asistencia inmediata. Siempre estamos en línea de 8 a. m. a 5 p. m. (EST). Si nos contactas fuera de ese horario, te responderemos lo antes posible. Además, puedes escribirnos por correo electrónico a [email protected]

Para darte la oportunidad de probar nuestras APIs sin compromiso, ofrecemos una prueba gratuita de 7 días que te permite realizar hasta 50 llamadas a la API sin costo. Esta prueba solo se puede usar una vez, por lo que recomendamos aplicarla a la API que más te interese. Aunque la mayoría de nuestras APIs ofrecen prueba gratuita, algunas pueden no hacerlo. La prueba finaliza después de 7 días o cuando realices 50 solicitudes, lo que ocurra primero. Si alcanzas el límite de 50 solicitudes durante la prueba, deberás "Iniciar tu Plan de Pago" para continuar haciendo solicitudes. Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios. Alternativamente, si no cancelas tu suscripción antes del día 7, tu prueba gratuita finalizará y tu plan se cobrará automáticamente, otorgándote acceso a todas las llamadas a la API especificadas en tu plan. Ten esto en cuenta para evitar cargos no deseados.

Después de 7 días, se te cobrará el monto total del plan al que estabas suscrito durante la prueba. Por lo tanto, es importante cancelar antes de que finalice el periodo de prueba. No se aceptan solicitudes de reembolso por olvidar cancelar a tiempo.

Cuando te suscribes a una prueba gratuita de una API, puedes realizar hasta 50 llamadas. Si deseas realizar más llamadas después de este límite, la API te pedirá que "Inicies tu Plan de Pago". Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios.

Las Órdenes de Pago se procesan entre el día 20 y el 30 de cada mes. Si envías tu solicitud antes del día 20, tu pago será procesado dentro de ese período.


APIs Relacionadas


También te puede interesar