Autype Lens
#Comprensión de documentos con **IA**
Autype Lens va más allá del OCR simple. Combina el reconocimiento óptico de caracteres con modelos visión-lenguaje para extraer no solo texto — sino también diseño, estilo y estructura de cualquier documento.
Documento de entrada
PDF, DOCX, ODT
Salida estructurada
md / mdd / json
Documento de entrada
PDF, DOCX, ODT
Salida estructurada
md / mdd / json
Dos tecnologías de IA, **un** pipeline
El OCR tradicional captura texto pero pierde todo lo demás. Los modelos visión-lenguaje comprenden páginas visualmente pero carecen de precisión. Autype Lens combina ambos en un solo pipeline — construido sobre modelos de código abierto afinados — para resultados que ninguno de los enfoques podría lograr por sí solo.
Reconocimiento óptico de caracteres
Extracción precisa de texto a nivel de carácter. Nuestros modelos OCR afinados manejan diseños complejos, páginas multicolumna y tablas incrustadas con alta precisión — incluso en documentos escaneados.
Modelos visión-lenguaje
Comprensión visual a nivel de página. Los VLM afinados analizan la página completa como imagen para comprender jerarquías de títulos, estilos de fuente, esquemas de color, márgenes y relaciones espaciales entre elementos.
Pipeline de extracción unificado
El paso OCR proporciona texto preciso. El paso VLM proporciona semántica del documento. Nuestro pipeline fusiona ambos — validado contra esquemas JSON y reintentado automáticamente si es necesario — para un resultado completo y estructurado.
Cuatro formas de **comprender** documentos
Autype Lens ofrece un conjunto de herramientas impulsadas por IA para diferentes tareas de comprensión de documentos — todas accesibles a través de una única API REST.
OCR inteligente
Convierte documentos a Markdown, Autype Extended Markdown (con estilo y valores predeterminados), o JSON Autype completo — listo para editar o regenerar. Soporta selección de páginas.
Clasificación de documentos
Categoriza documentos automáticamente en tus categorías personalizadas. Sube un documento, proporciona tus etiquetas y obtén la mejor coincidencia con puntuación de confianza.
Extracción de datos estructurados
Define un esquema de campos y deja que Lens extraiga datos estructurados de cualquier documento. Números de factura, fechas, nombres, importes — lo que tu flujo de trabajo necesite.
Generación de nombres de archivo con IA
Proporciona un patrón de nombres como factura-{numero}-{fecha} y Lens lee el documento para rellenar los marcadores. Automatiza la organización de tus archivos.
Tres niveles de **salida**
Elige la profundidad de extracción que necesitas. Desde texto bruto hasta un documento completamente estilizado y regenerable.
Markdown estándar
Extracción de texto bruto como Markdown limpio. Rápido y ligero — ideal para indexación de búsqueda o migración de contenido.
# Quarterly Report Revenue grew by **23%** compared to last quarter. ## Key Metrics | Metric | Value | |----------|-------| | Revenue | €1.2M | | Growth | 23% |
Autype Extended Markdown
Markdown más configuración completa del documento, estilos predeterminados, encabezados y pies de página. Regenera con el aspecto original.
---document
size: A4
marginTop: 2.5
marginBottom: 2
---defaults
fontFamily: Inter
fontSize: 11
color: #333333
styles:
h1:
color: #1a365d
fontSize: 24
---
# Quarterly Report
Revenue grew by **23%**
compared to last quarter.Autype Document JSON
Documento estructurado completo con secciones, elementos y estilo — listo para importar en Autype o procesar programáticamente.
{
"defaults": {
"fontFamily": "Inter",
"fontSize": 11,
"styles": {
"h1": { "color": "#1a365d" }
}
},
"sections": [
{
"type": "flow",
"content": [
{ "type": "h1", "text": "Report" },
{ "type": "text", "text": "Revenue grew by **23%**" }
]
}
]
}Diseñado para **flujos** reales
Autype Lens se integra en pipelines de documentos donde el OCR básico no es suficiente.
Digitalización de documentos
Convierte PDFs escaneados y documentos heredados en formatos estructurados y editables — preservando el diseño y el estilo originales.
Migración de contenido
Mueve documentos entre sistemas sin perder el formato. Extrae contenido con estilo y regenéralo en Autype o cualquier otra plataforma.
Archivo automatizado
Clasifica documentos entrantes, extrae campos clave y genera nombres de archivo automáticamente. Construye pipelines de entrada de documentos completamente automáticos.
Extracción de datos
Extrae datos estructurados de facturas, contratos, informes y formularios. Define tu esquema una vez y extrae a escala a través de la API.
A una llamada API de **distancia**
Integra Lens en tu flujo de trabajo con una simple llamada API REST. Sube un archivo, elige tu formato de salida y obtén resultados estructurados.
curl -X POST https://api.autype.com/api/v1/dev/tools/lens/ocr \
-H "X-API-Key: your_api_key" \
-H "Content-Type: application/json" \
-d '{
"fileId": "550e8400-e29b-41d4-a716-446655440000",
"outputFormat": "mdd"
}'{
"id": "job_abc123",
"status": "COMPLETED",
"result": {
"outputFormat": "mdd",
"content": "---document\nsize: A4\n---defaults\nfontFamily: Inter\n---\n# Report Title\n\nContent with **styling** preserved..."
}
}Disponible en planes Pro y Team. 4 créditos por página.
¿Listo para ir más allá del **OCR**?
Comienza hoy a extraer texto, diseño y estilo de tus documentos.
