Autype Lens

#KI-gestütztes Dokumentenverständnis

Autype Lens geht über einfaches OCR hinaus. Es kombiniert Texterkennung mit Vision-Language-Modellen, um Text, Layout, Styling und Struktur aus jedem Dokument zu extrahieren.

Autype Lens testen Zur Dokumentation

Dokument-Eingabe

PDF, DOCX, ODT

Autype Lens

Inhalt extrahieren

Layout erkennen

Styling identifizieren

Klassifizieren & extrahieren

Strukturierte Ausgabe

md / mdd / json

Dokument-Eingabe

PDF, DOCX, ODT

Autype Lens

Inhalt extrahieren

Layout erkennen

Styling identifizieren

Klassifizieren & extrahieren

Strukturierte Ausgabe

md / mdd / json

Zwei KI-Technologien, eine Pipeline

Herkömmliches OCR erfasst Text, verliert aber alles andere. Vision-Language-Modelle verstehen Seiten visuell, haben aber Präzisionsprobleme. Autype Lens kombiniert beides in einer einzigen Pipeline (aufgebaut auf feinjustierten Open-Source-Modellen) für Ergebnisse, die keiner der Ansätze allein liefern könnte.

Optische Zeichenerkennung

Präzise Textextraktion auf Zeichenebene. Unsere feinjustierten OCR-Modelle verarbeiten komplexe Layouts, mehrspaltige Seiten und eingebettete Tabellen mit hoher Genauigkeit, auch bei gescannten Dokumenten.

Vision-Language-Modelle

Visuelles Verständnis auf Seitenebene. Feinjustierte VLMs analysieren die gesamte Seite als Bild, um Überschriftshierarchien, Schriftstile, Farbschemata, Abstände und räumliche Beziehungen zwischen Elementen zu erkennen.

Vereinte Extraktions-Pipeline

Der OCR-Durchlauf liefert präzisen Text. Der VLM-Durchlauf liefert Dokumentsemantik. Unsere Pipeline vereint beides, validiert die Ausgabe gegen JSON-Schemas und wiederholt bei Bedarf automatisch.

Aufgebaut auf feinjustierten Open-Source-Modellen

Ausgabe validiert gegen JSON-Schemas

Automatische Wiederholung mit Fehler-Feedback

Vier Wege, Dokumente zu verstehen

Jede Operation zielt auf eine andere Dokumentenverständnis-Aufgabe ab. Alle sind über einen einzigen REST-API-Endpunkt zugänglich.

Acme Corp

Quarterly Report

Quarterly Report Q4

Revenue grew by 23% compared to last quarter, driven by enterprise adoption and new product launches across all regions.

●Onboarded 18 new clients
●Retention rate at 94%
●3 new markets planned for Q1

chart-q4.png

Key Metrics

MetricValueChange

Revenue€1.2M+23%

Clients142+18

Margin18%+3%

International expansion is on track with 3 new markets planned for Q1 2025. Operating margins improved to 18%.

Page 1 / 3

Extrahierte Ausgabe

# Quarterly Report Q4

Revenue grew by **23%** compared to
last quarter, driven by enterprise
adoption across all regions.

Key achievements this quarter:

- Onboarded **18 new clients**
- Retention rate at 94%
- 3 new markets planned for Q1

![Q4 Chart](/output/chart-q4.png)

## Key Metrics

:::table{}headerBg=#f0f0f0 rowAltBg=#fafafa{}
| Metric   | Value  | Change |
|----------|--------|--------|
| Revenue  | €1.2M  | +23%   |
| Clients  | 142    | +18    |
| Margin   | 18%    | +3%    |
:::

Text, Überschriften, Tabellen und Struktur als Markdown oder JSON erhalten.

OCR

Intelligentes OCR

Konvertiere Dokumente in Markdown, Autype Extended Markdown (mit Styling & Defaults) oder vollständiges Autype JSON. Alle Formate sind sofort editier- und renderbar. Unterstützt Seitenauswahl.

Sterling & Associates

Confidential

Service Agreement

This Service Agreement (“Agreement”) is entered into as of March 15, 2025, by and between Sterling & Associates (“Provider”) and Globex Industries (“Client”).

1. Scope of Services

The Provider shall deliver consulting services as described in Exhibit A, including strategic planning, market analysis, and quarterly reviews.

2. Compensation

The Client agrees to pay a monthly retainer of €8,500 for the duration of this Agreement, due within 30 days of invoice.

3. Term & Termination

This Agreement shall commence on the date above and continue for a period of 12 months, unless terminated by either party with 30 days written notice.

Sterling & AssociatesPage 1 of 4

Request

{
  "fileId": "550e8400-...",
  "labels": [
    "contract", "invoice",
    "report", "letter"
  ]
}

Klassifizierungsergebnis

{
  "category": "contract",
  "confidence": 0.95,
  "labels": [
    { "name": "contract", "score": 0.95 },
    { "name": "letter", "score": 0.03 },
    { "name": "report", "score": 0.02 }
  ]
}

Gibt die passende Kategorie mit Konfidenzwert zurück.

Klassifizieren

Dokumentenklassifizierung

Kategorisiere Dokumente automatisch in deine eigenen Kategorien. Lade ein Dokument hoch, gib deine Labels an und erhalte die beste Übereinstimmung mit Konfidenzwert.

Acme Corp

123 Business St, Munich

INVOICE

INV-2025-0042

Bill to:

Globex Industries

Berlin, Germany

Date: 2025-03-15

Due: 2025-04-15

DescriptionQtyAmount

Consulting Services40h€3,500.00

Travel Expenses1€750.00

Total€4,250.00

All amounts in EUR

Payment terms: 30 days net · IBAN: DE89 3704 0044 0532 0130 00

Acme Corp · VAT ID: DE123456789

Request

{
  "fileId": "550e8400-...",
  "schema": {
    "invoiceNumber": "string",
    "date": "string",
    "vendor": "string",
    "total": "number",
    "currency": "string",
    "lineItems": "array"
  }
}

Extrahierte Felder

{
  "invoiceNumber": "INV-2025-0042",
  "date": "2025-03-15",
  "vendor": "Acme Corp",
  "total": 4250.00,
  "currency": "EUR",
  "lineItems": [
    { "description": "Consulting", "amount": 3500 },
    { "description": "Expenses", "amount": 750 }
  ]
}

Strukturiertes JSON mit jedem Feld aus deinem Schema ausgefüllt.

Extrahieren

Strukturierte Datenextraktion

Definiere ein Feld-Schema und lass Lens strukturierte Daten aus jedem Dokument extrahieren. Funktioniert für Rechnungsnummern, Daten, Namen, Beträge und alles andere, was dein Workflow braucht.

35 files

Acme Corp

123 Business St, Munich

INVOICE

INV-2025-0042

Bill to:

Globex Industries

Berlin, Germany

Date: 2025-03-15

Due: 2025-04-15

DescriptionQtyAmount

Consulting Services40h€3,500.00

Travel Expenses1€750.00

Total€4,250.00

Payment terms: 30 days net · IBAN: DE89 3704 0044 0532 0130 00

Acme Corp · VAT ID: DE123456789

Request

{
  "fileId": "550e8400-...",
  "filenameSchema": "invoice-{number}_{date}"
}

Generierter Dateiname

[
  { "fileId": "550e8400-...", "filename": "invoice-INV-2025-0042_2025-03-15" },
  { "fileId": "7a3b1c90-...", "filename": "invoice-INV-2025-0039_2025-03-10" },
  { "fileId": "b2f4e8d1-...", "filename": "invoice-INV-2025-0038_2025-03-08" },
  { "fileId": "c9d5a6f2-...", "filename": "invoice-INV-2025-0035_2025-03-01" },
  { "fileId": "e1a7b3c4-...", "filename": "invoice-INV-2025-0033_2025-02-28" },
  { "fileId": "f8c2d9e5-...", "filename": "invoice-INV-2025-0031_2025-02-25" },
  { "fileId": "a4b6c8d0-...", "filename": "invoice-INV-2025-0029_2025-02-20" },
  { "fileId": "d3e5f7a9-...", "filename": "invoice-INV-2025-0027_2025-02-15" },
  { "fileId": "1b2c3d4e-...", "filename": "invoice-INV-2025-0024_2025-02-10" },
  { "fileId": "5f6a7b8c-...", "filename": "invoice-INV-2025-0021_2025-02-05" },
  ...  // 25 more results
]

Muster-Platzhalter ersetzt mit Werten aus dem Dokument.

Benennung

KI-Dateinamen-Generierung

Gib ein Benennungsmuster wie rechnung-{nummer}-{datum} an und Lens liest das Dokument, um die Platzhalter zu füllen. Automatisiere deine Dateiorganisation.

Bilder inklusive bei der Extraktion

Bei mdd- oder JSON-Ausgabe erkennt und extrahiert Lens alle eingebetteten Bilder aus dem Dokument. Jedes Bild erhält eine Download-URL, sodass du es in deiner Pipeline verwenden oder in einem neuen Dokument rendern kannst. Kein zusätzlicher Schritt nötig.

image-001.png

Drei Ausgabe-Level

Wähle die Extraktionstiefe, die du brauchst. Von Rohtext bis zum vollständig gestylten, renderbaren Dokument.

Standard Markdown

Rohe Textextraktion als sauberes Markdown. Schnell, leichtgewichtig und ideal für Suchindexierung oder Content-Migration.

# Quarterly Report

Revenue grew by **23%**
compared to last quarter.

## Key Metrics

| Metric   | Value |
|----------|-------|
| Revenue  | €1.2M |
| Growth   | 23%   |

mdd

Autype Extended Markdown

Markdown plus vollständige Dokumenteinstellungen, Styling-Defaults, Kopf- und Fußzeilen. Rendere mit dem Original-Look.

---document
size: A4
marginTop: 2.5
marginBottom: 2
---defaults
fontFamily: Inter
fontSize: 11
color: #333333
---
# Quarterly Report

Revenue grew by **23%**

json

Autype Document JSON

Vollständig strukturiertes Dokument mit Sections, Elementen und Styling. Bereit zum Import in Autype oder zur programmatischen Verarbeitung.

{
  "defaults": {
    "fontFamily": "Inter",
    "fontSize": 11
  },
  "sections": [{
    "type": "flow",
    "content": [
      { "type": "h1", "text": "Report" }
    ]
  }]
}

Gebaut für echte Workflows

Autype Lens passt in Dokumenten-Pipelines, in denen einfaches OCR nicht ausreicht.

Dokumenten-Digitalisierung

Konvertiere gescannte PDFs und Legacy-Dokumente in bearbeitbare, strukturierte Formate. Das Original-Layout und -Design bleiben erhalten.

Content-Migration

Verschiebe Dokumente zwischen Systemen, ohne Formatierung zu verlieren. Extrahiere gestylten Inhalt und rendere ihn in Autype oder jeder anderen Plattform.

Automatisierte Ablage

Klassifiziere eingehende Dokumente, extrahiere Schlüsselfelder und generiere Dateinamen automatisch. Baue vollautomatische Dokumenten-Eingangs-Pipelines.

Datenextraktion

Extrahiere strukturierte Daten aus Rechnungen, Verträgen, Berichten und Formularen. Definiere dein Schema einmal und extrahiere über die API im großen Stil.

Ein API-Aufruf entfernt

Integriere Lens in deinen Workflow mit einem einfachen REST-API-Aufruf. Lade eine Datei hoch, wähle dein Ausgabeformat und erhalte strukturierte Ergebnisse.

Request

curl -X POST https://api.autype.com/api/v1/dev/tools/lens/ocr \
  -H "X-API-Key: your_api_key" \
  -H "Content-Type: application/json" \
  -d '{
    "fileId": "550e8400-e29b-41d4-a716-446655440000",
    "outputFormat": "mdd"
  }'

Response

{
  "id": "job_abc123",
  "status": "COMPLETED",
  "result": {
    "outputFormat": "mdd",
    "content": "---document\nsize: A4\n---defaults\nfontFamily: Inter\n---\n# Report Title\n\nContent with **styling** preserved..."
  }
}

Verfügbar in allen Plänen. 4 Credits pro Seite.

Bereit, über OCR hinauszugehen?

Beginne noch heute, Text, Layout und Styling aus deinen Dokumenten zu extrahieren.

Jetzt starten API-Docs ansehen