Autype Lens
#Comprensión de documentos con IA
Autype Lens va más allá del OCR simple. Combina el reconocimiento óptico de caracteres con modelos visión-lenguaje para extraer texto, diseño, estilo y estructura de cualquier documento.
Documento de entrada
PDF, DOCX, ODT
Salida estructurada
md / mdd / json
Documento de entrada
PDF, DOCX, ODT
Salida estructurada
md / mdd / json
Dos tecnologías de IA, un pipeline
El OCR tradicional captura texto pero pierde todo lo demás. Los modelos visión-lenguaje comprenden páginas visualmente pero carecen de precisión. Autype Lens combina ambos en un solo pipeline (construido sobre modelos de código abierto afinados) para resultados que ninguno de los enfoques podría lograr por sí solo.
Reconocimiento óptico de caracteres
Extracción precisa de texto a nivel de carácter. Nuestros modelos OCR afinados manejan diseños complejos, páginas multicolumna y tablas incrustadas con alta precisión, incluso en documentos escaneados.
Modelos visión-lenguaje
Comprensión visual a nivel de página. Los VLM afinados analizan la página completa como imagen para comprender jerarquías de títulos, estilos de fuente, esquemas de color, márgenes y relaciones espaciales entre elementos.
Pipeline de extracción unificado
El paso OCR proporciona texto preciso. El paso VLM proporciona semántica del documento. Nuestro pipeline fusiona ambos, valida la salida contra esquemas JSON y reintenta automáticamente si es necesario.
Cuatro formas de comprender documentos
Autype Lens ofrece un conjunto de herramientas impulsadas por IA para diferentes tareas de comprensión de documentos, todas accesibles a través de una única API REST.
Revenue grew by 23% compared to last quarter, driven by enterprise adoption and new product launches across all regions.
- ●Onboarded 18 new clients
- ●Retention rate at 94%
- ●3 new markets planned for Q1
International expansion is on track with 3 new markets planned for Q1 2025. Operating margins improved to 18%.
# Quarterly Report Q4 Revenue grew by **23%** compared to last quarter, driven by enterprise adoption across all regions. Key achievements this quarter: - Onboarded **18 new clients** - Retention rate at 94% - 3 new markets planned for Q1  ## Key Metrics :::table{}headerBg=#f0f0f0 rowAltBg=#fafafa{} | Metric | Value | Change | |----------|--------|--------| | Revenue | €1.2M | +23% | | Clients | 142 | +18 | | Margin | 18% | +3% | :::
Texto, títulos, tablas y estructura preservados como Markdown o JSON.
OCR inteligente
Convierte documentos a Markdown, Autype Extended Markdown (con estilo y valores predeterminados), o JSON Autype completo. Todos los formatos están listos para editar o regenerar. Soporta selección de páginas.
Service Agreement
This Service Agreement (“Agreement”) is entered into as of March 15, 2025, by and between Sterling & Associates (“Provider”) and Globex Industries (“Client”).
1. Scope of Services
The Provider shall deliver consulting services as described in Exhibit A, including strategic planning, market analysis, and quarterly reviews.
2. Compensation
The Client agrees to pay a monthly retainer of €8,500 for the duration of this Agreement, due within 30 days of invoice.
3. Term & Termination
This Agreement shall commence on the date above and continue for a period of 12 months, unless terminated by either party with 30 days written notice.
{ "fileId": "550e8400-...", "labels": [ "contract", "invoice", "report", "letter" ] }
{ "category": "contract", "confidence": 0.95, "labels": [ { "name": "contract", "score": 0.95 }, { "name": "letter", "score": 0.03 }, { "name": "report", "score": 0.02 } ] }
Devuelve la categoría coincidente con puntuación de confianza.
Clasificación de documentos
Categoriza documentos automáticamente en tus categorías personalizadas. Sube un documento, proporciona tus etiquetas y obtén la mejor coincidencia con puntuación de confianza.
Acme Corp
123 Business St, Munich
INVOICE
INV-2025-0042
Bill to:
Globex Industries
Berlin, Germany
Date: 2025-03-15
Due: 2025-04-15
All amounts in EUR
Payment terms: 30 days net · IBAN: DE89 3704 0044 0532 0130 00
{ "fileId": "550e8400-...", "schema": { "invoiceNumber": "string", "date": "string", "vendor": "string", "total": "number", "currency": "string", "lineItems": "array" } }
{ "invoiceNumber": "INV-2025-0042", "date": "2025-03-15", "vendor": "Acme Corp", "total": 4250.00, "currency": "EUR", "lineItems": [ { "description": "Consulting", "amount": 3500 }, { "description": "Expenses", "amount": 750 } ] }
JSON estructurado con cada campo de tu esquema completado.
Extracción de datos estructurados
Define un esquema de campos y deja que Lens extraiga datos estructurados de cualquier documento. Funciona para números de factura, fechas, nombres, importes y todo lo que tu flujo de trabajo necesite.
Acme Corp
123 Business St, Munich
INVOICE
INV-2025-0042
Bill to:
Globex Industries
Berlin, Germany
Date: 2025-03-15
Due: 2025-04-15
Payment terms: 30 days net · IBAN: DE89 3704 0044 0532 0130 00
{ "fileId": "550e8400-...", "filenameSchema": "invoice-{number}_{date}" }
[ { "fileId": "550e8400-...", "filename": "invoice-INV-2025-0042_2025-03-15" }, { "fileId": "7a3b1c90-...", "filename": "invoice-INV-2025-0039_2025-03-10" }, { "fileId": "b2f4e8d1-...", "filename": "invoice-INV-2025-0038_2025-03-08" }, { "fileId": "c9d5a6f2-...", "filename": "invoice-INV-2025-0035_2025-03-01" }, { "fileId": "e1a7b3c4-...", "filename": "invoice-INV-2025-0033_2025-02-28" }, { "fileId": "f8c2d9e5-...", "filename": "invoice-INV-2025-0031_2025-02-25" }, { "fileId": "a4b6c8d0-...", "filename": "invoice-INV-2025-0029_2025-02-20" }, { "fileId": "d3e5f7a9-...", "filename": "invoice-INV-2025-0027_2025-02-15" }, { "fileId": "1b2c3d4e-...", "filename": "invoice-INV-2025-0024_2025-02-10" }, { "fileId": "5f6a7b8c-...", "filename": "invoice-INV-2025-0021_2025-02-05" }, ... // 25 more results ]
Marcadores de patrón reemplazados con valores leídos del documento.
Generación de nombres de archivo con IA
Proporciona un patrón de nombres como factura-{numero}-{fecha} y Lens lee el documento para rellenar los marcadores. Automatiza la organización de tus archivos.
Imágenes incluidas en la extracción
Al usar salida mdd o JSON, Lens detecta y extrae todas las imágenes incrustadas del documento. Cada imagen obtiene una URL de descarga para que puedas usarlas en tu pipeline o regenerarlas en un nuevo documento. No se requiere paso adicional.
Tres niveles de salida
Elige la profundidad de extracción que necesitas. Desde texto bruto hasta un documento completamente estilizado y regenerable.
Markdown estándar
Extracción de texto bruto como Markdown limpio. Rápido, ligero e ideal para indexación de búsqueda o migración de contenido.
# Quarterly Report Revenue grew by **23%** compared to last quarter. ## Key Metrics | Metric | Value | |----------|-------| | Revenue | €1.2M | | Growth | 23% |
Autype Extended Markdown
Markdown más configuración completa del documento, estilos predeterminados, encabezados y pies de página. Regenera con el aspecto original.
---document size: A4 marginTop: 2.5 marginBottom: 2 ---defaults fontFamily: Inter fontSize: 11 color: #333333 --- # Quarterly Report Revenue grew by **23%**
Autype Document JSON
Documento estructurado completo con secciones, elementos y estilo. Listo para importar en Autype o procesar programáticamente.
{ "defaults": { "fontFamily": "Inter", "fontSize": 11 }, "sections": [{ "type": "flow", "content": [ { "type": "h1", "text": "Report" } ] }] }
Diseñado para flujos reales
Autype Lens se integra en pipelines de documentos donde el OCR básico no es suficiente.
Digitalización de documentos
Convierte PDFs escaneados y documentos heredados en formatos estructurados y editables. El diseño y el estilo originales se conservan.
Migración de contenido
Mueve documentos entre sistemas sin perder el formato. Extrae contenido con estilo y regenéralo en Autype o cualquier otra plataforma.
Archivo automatizado
Clasifica documentos entrantes, extrae campos clave y genera nombres de archivo automáticamente. Construye pipelines de entrada de documentos completamente automáticos.
Extracción de datos
Extrae datos estructurados de facturas, contratos, informes y formularios. Define tu esquema una vez y extrae a escala a través de la API.
A una llamada API de distancia
Integra Lens en tu flujo de trabajo con una simple llamada API REST. Sube un archivo, elige tu formato de salida y obtén resultados estructurados.
curl -X POST https://api.autype.com/api/v1/dev/tools/lens/ocr \ -H "X-API-Key: your_api_key" \ -H "Content-Type: application/json" \ -d '{ "fileId": "550e8400-e29b-41d4-a716-446655440000", "outputFormat": "mdd" }'
{ "id": "job_abc123", "status": "COMPLETED", "result": { "outputFormat": "mdd", "content": "---document\nsize: A4\n---defaults\nfontFamily: Inter\n---\n# Report Title\n\nContent with **styling** preserved..." } }
Disponible en todos los planes. 4 créditos por página.
¿Listo para ir más allá del OCR?
Comienza hoy a extraer texto, diseño y estilo de tus documentos.
