Autype
Autype

Autype Lens

#Comprensión de documentos con IA

Autype Lens va más allá del OCR simple. Combina el reconocimiento óptico de caracteres con modelos visión-lenguaje para extraer texto, diseño, estilo y estructura de cualquier documento.

Documento de entrada

PDF, DOCX, ODT

Autype Lens
Extraer contenido
Detectar diseño
Identificar estilo
Clasificar y extraer

Salida estructurada

md / mdd / json

Dos tecnologías de IA, un pipeline

El OCR tradicional captura texto pero pierde todo lo demás. Los modelos visión-lenguaje comprenden páginas visualmente pero carecen de precisión. Autype Lens combina ambos en un solo pipeline (construido sobre modelos de código abierto afinados) para resultados que ninguno de los enfoques podría lograr por sí solo.

Reconocimiento óptico de caracteres

Extracción precisa de texto a nivel de carácter. Nuestros modelos OCR afinados manejan diseños complejos, páginas multicolumna y tablas incrustadas con alta precisión, incluso en documentos escaneados.

Modelos visión-lenguaje

Comprensión visual a nivel de página. Los VLM afinados analizan la página completa como imagen para comprender jerarquías de títulos, estilos de fuente, esquemas de color, márgenes y relaciones espaciales entre elementos.

Pipeline de extracción unificado

El paso OCR proporciona texto preciso. El paso VLM proporciona semántica del documento. Nuestro pipeline fusiona ambos, valida la salida contra esquemas JSON y reintenta automáticamente si es necesario.

Construido sobre modelos de código abierto afinados
Salida validada contra esquemas JSON
Reintento automático con retroalimentación de errores

Cuatro formas de comprender documentos

Autype Lens ofrece un conjunto de herramientas impulsadas por IA para diferentes tareas de comprensión de documentos, todas accesibles a través de una única API REST.

Acme Corp
Quarterly Report
Quarterly Report Q4

Revenue grew by 23% compared to last quarter, driven by enterprise adoption and new product launches across all regions.

  • Onboarded 18 new clients
  • Retention rate at 94%
  • 3 new markets planned for Q1
chart-q4.png
Key Metrics
MetricValueChange
Revenue€1.2M+23%
Clients142+18
Margin18%+3%

International expansion is on track with 3 new markets planned for Q1 2025. Operating margins improved to 18%.

Page 1 / 3
Salida extraída
# Quarterly Report Q4

Revenue grew by **23%** compared to
last quarter, driven by enterprise
adoption across all regions.

Key achievements this quarter:

- Onboarded **18 new clients**
- Retention rate at 94%
- 3 new markets planned for Q1

![Q4 Chart](/output/chart-q4.png)

## Key Metrics

:::table{}headerBg=#f0f0f0 rowAltBg=#fafafa{}
| Metric   | Value  | Change |
|----------|--------|--------|
| Revenue  | €1.2M  | +23%   |
| Clients  | 142    | +18    |
| Margin   | 18%    | +3%    |
:::

Texto, títulos, tablas y estructura preservados como Markdown o JSON.

OCR

OCR inteligente

Convierte documentos a Markdown, Autype Extended Markdown (con estilo y valores predeterminados), o JSON Autype completo. Todos los formatos están listos para editar o regenerar. Soporta selección de páginas.

Sterling & Associates
Confidential

Service Agreement

This Service Agreement (“Agreement”) is entered into as of March 15, 2025, by and between Sterling & Associates (“Provider”) and Globex Industries (“Client”).

1. Scope of Services

The Provider shall deliver consulting services as described in Exhibit A, including strategic planning, market analysis, and quarterly reviews.

2. Compensation

The Client agrees to pay a monthly retainer of €8,500 for the duration of this Agreement, due within 30 days of invoice.

3. Term & Termination

This Agreement shall commence on the date above and continue for a period of 12 months, unless terminated by either party with 30 days written notice.

Sterling & AssociatesPage 1 of 4
Request
{
  "fileId": "550e8400-...",
  "labels": [
    "contract", "invoice",
    "report", "letter"
  ]
}
Resultado de clasificación
{
  "category": "contract",
  "confidence": 0.95,
  "labels": [
    { "name": "contract", "score": 0.95 },
    { "name": "letter", "score": 0.03 },
    { "name": "report", "score": 0.02 }
  ]
}

Devuelve la categoría coincidente con puntuación de confianza.

Clasificar

Clasificación de documentos

Categoriza documentos automáticamente en tus categorías personalizadas. Sube un documento, proporciona tus etiquetas y obtén la mejor coincidencia con puntuación de confianza.

Acme Corp

123 Business St, Munich

INVOICE

INV-2025-0042

Bill to:

Globex Industries

Berlin, Germany

Date: 2025-03-15

Due: 2025-04-15

DescriptionQtyAmount
Consulting Services40h€3,500.00
Travel Expenses1€750.00
Total€4,250.00

All amounts in EUR

Payment terms: 30 days net · IBAN: DE89 3704 0044 0532 0130 00

Acme Corp · VAT ID: DE123456789
Request
{
  "fileId": "550e8400-...",
  "schema": {
    "invoiceNumber": "string",
    "date": "string",
    "vendor": "string",
    "total": "number",
    "currency": "string",
    "lineItems": "array"
  }
}
Campos extraídos
{
  "invoiceNumber": "INV-2025-0042",
  "date": "2025-03-15",
  "vendor": "Acme Corp",
  "total": 4250.00,
  "currency": "EUR",
  "lineItems": [
    { "description": "Consulting", "amount": 3500 },
    { "description": "Expenses", "amount": 750 }
  ]
}

JSON estructurado con cada campo de tu esquema completado.

Extraer

Extracción de datos estructurados

Define un esquema de campos y deja que Lens extraiga datos estructurados de cualquier documento. Funciona para números de factura, fechas, nombres, importes y todo lo que tu flujo de trabajo necesite.

35 files

Acme Corp

123 Business St, Munich

INVOICE

INV-2025-0042

Bill to:

Globex Industries

Berlin, Germany

Date: 2025-03-15

Due: 2025-04-15

DescriptionQtyAmount
Consulting Services40h€3,500.00
Travel Expenses1€750.00
Total€4,250.00

Payment terms: 30 days net · IBAN: DE89 3704 0044 0532 0130 00

Acme Corp · VAT ID: DE123456789
Request
{
  "fileId": "550e8400-...",
  "filenameSchema": "invoice-{number}_{date}"
}
Nombre de archivo generado
[
  { "fileId": "550e8400-...", "filename": "invoice-INV-2025-0042_2025-03-15" },
  { "fileId": "7a3b1c90-...", "filename": "invoice-INV-2025-0039_2025-03-10" },
  { "fileId": "b2f4e8d1-...", "filename": "invoice-INV-2025-0038_2025-03-08" },
  { "fileId": "c9d5a6f2-...", "filename": "invoice-INV-2025-0035_2025-03-01" },
  { "fileId": "e1a7b3c4-...", "filename": "invoice-INV-2025-0033_2025-02-28" },
  { "fileId": "f8c2d9e5-...", "filename": "invoice-INV-2025-0031_2025-02-25" },
  { "fileId": "a4b6c8d0-...", "filename": "invoice-INV-2025-0029_2025-02-20" },
  { "fileId": "d3e5f7a9-...", "filename": "invoice-INV-2025-0027_2025-02-15" },
  { "fileId": "1b2c3d4e-...", "filename": "invoice-INV-2025-0024_2025-02-10" },
  { "fileId": "5f6a7b8c-...", "filename": "invoice-INV-2025-0021_2025-02-05" },
  ...  // 25 more results
]

Marcadores de patrón reemplazados con valores leídos del documento.

Nombrado

Generación de nombres de archivo con IA

Proporciona un patrón de nombres como factura-{numero}-{fecha} y Lens lee el documento para rellenar los marcadores. Automatiza la organización de tus archivos.

Imágenes incluidas en la extracción

Al usar salida mdd o JSON, Lens detecta y extrae todas las imágenes incrustadas del documento. Cada imagen obtiene una URL de descarga para que puedas usarlas en tu pipeline o regenerarlas en un nuevo documento. No se requiere paso adicional.

image-001.png

Tres niveles de salida

Elige la profundidad de extracción que necesitas. Desde texto bruto hasta un documento completamente estilizado y regenerable.

md

Markdown estándar

Extracción de texto bruto como Markdown limpio. Rápido, ligero e ideal para indexación de búsqueda o migración de contenido.

# Quarterly Report

Revenue grew by **23%**
compared to last quarter.

## Key Metrics

| Metric   | Value |
|----------|-------|
| Revenue  | €1.2M |
| Growth   | 23%   |
mdd

Autype Extended Markdown

Markdown más configuración completa del documento, estilos predeterminados, encabezados y pies de página. Regenera con el aspecto original.

---document
size: A4
marginTop: 2.5
marginBottom: 2
---defaults
fontFamily: Inter
fontSize: 11
color: #333333
---
# Quarterly Report

Revenue grew by **23%**
json

Autype Document JSON

Documento estructurado completo con secciones, elementos y estilo. Listo para importar en Autype o procesar programáticamente.

{
  "defaults": {
    "fontFamily": "Inter",
    "fontSize": 11
  },
  "sections": [{
    "type": "flow",
    "content": [
      { "type": "h1", "text": "Report" }
    ]
  }]
}

Diseñado para flujos reales

Autype Lens se integra en pipelines de documentos donde el OCR básico no es suficiente.

Digitalización de documentos

Convierte PDFs escaneados y documentos heredados en formatos estructurados y editables. El diseño y el estilo originales se conservan.

Migración de contenido

Mueve documentos entre sistemas sin perder el formato. Extrae contenido con estilo y regenéralo en Autype o cualquier otra plataforma.

Archivo automatizado

Clasifica documentos entrantes, extrae campos clave y genera nombres de archivo automáticamente. Construye pipelines de entrada de documentos completamente automáticos.

Extracción de datos

Extrae datos estructurados de facturas, contratos, informes y formularios. Define tu esquema una vez y extrae a escala a través de la API.

A una llamada API de distancia

Integra Lens en tu flujo de trabajo con una simple llamada API REST. Sube un archivo, elige tu formato de salida y obtén resultados estructurados.

Request
curl -X POST https://api.autype.com/api/v1/dev/tools/lens/ocr \
  -H "X-API-Key: your_api_key" \
  -H "Content-Type: application/json" \
  -d '{
    "fileId": "550e8400-e29b-41d4-a716-446655440000",
    "outputFormat": "mdd"
  }'
Response
{
  "id": "job_abc123",
  "status": "COMPLETED",
  "result": {
    "outputFormat": "mdd",
    "content": "---document\nsize: A4\n---defaults\nfontFamily: Inter\n---\n# Report Title\n\nContent with **styling** preserved..."
  }
}

Disponible en todos los planes. 4 créditos por página.

¿Listo para ir más allá del OCR?

Comienza hoy a extraer texto, diseño y estilo de tus documentos.