Autype
Autype

Autype Lens

#KI-gestütztes Dokumenten-**Verständnis**

Autype Lens geht über einfaches OCR hinaus. Es kombiniert Texterkennung mit Vision-Language-Modellen, um nicht nur Text — sondern auch Layout, Styling und Struktur aus jedem Dokument zu extrahieren.

Dokument-Eingabe

PDF, DOCX, ODT

Autype Lens
Inhalt extrahieren
Layout erkennen
Styling identifizieren
Klassifizieren & extrahieren

Strukturierte Ausgabe

md / mdd / json

Zwei KI-Technologien, **eine** Pipeline

Herkömmliches OCR erfasst Text, verliert aber alles andere. Vision-Language-Modelle verstehen Seiten visuell, haben aber Präzisionsprobleme. Autype Lens kombiniert beides in einer einzigen Pipeline — aufgebaut auf feinjustierten Open-Source-Modellen — für Ergebnisse, die keiner der Ansätze allein liefern könnte.

Optische Zeichenerkennung

Präzise Textextraktion auf Zeichenebene. Unsere feinjustierten OCR-Modelle verarbeiten komplexe Layouts, mehrspaltige Seiten und eingebettete Tabellen mit hoher Genauigkeit — auch bei gescannten Dokumenten.

Vision-Language-Modelle

Visuelles Verständnis auf Seitenebene. Feinjustierte VLMs analysieren die gesamte Seite als Bild, um Überschriftshierarchien, Schriftstile, Farbschemata, Abstände und räumliche Beziehungen zwischen Elementen zu erkennen.

Vereinte Extraktions-Pipeline

Der OCR-Durchlauf liefert präzisen Text. Der VLM-Durchlauf liefert Dokumentsemantik. Unsere Pipeline vereint beides — validiert gegen JSON-Schemas und bei Bedarf automatisch wiederholt — für ein vollständiges, strukturiertes Ergebnis.

Aufgebaut auf feinjustierten Open-Source-Modellen
Ausgabe validiert gegen JSON-Schemas
Automatische Wiederholung mit Fehler-Feedback

Vier Wege, Dokumente zu **verstehen**

Autype Lens bietet ein Set an KI-gestützten Tools für verschiedene Dokumentenverständnis-Aufgaben — alle über eine einzige REST API zugänglich.

01OCR

Intelligentes OCR

Konvertiere Dokumente in Markdown, Autype Extended Markdown (mit Styling & Defaults) oder vollständiges Autype JSON — bereit zum Bearbeiten oder Rendern. Unterstützt Seitenauswahl.

02Klassifizieren

Dokumentenklassifizierung

Kategorisiere Dokumente automatisch in deine eigenen Kategorien. Lade ein Dokument hoch, gib deine Labels an und erhalte die beste Übereinstimmung mit Konfidenzwert.

03Extrahieren

Strukturierte Datenextraktion

Definiere ein Feld-Schema und lass Lens strukturierte Daten aus jedem Dokument extrahieren. Rechnungsnummern, Daten, Namen, Beträge — was immer dein Workflow braucht.

04Benennung

KI-Dateinamen-Generierung

Gib ein Benennungsmuster wie rechnung-{nummer}-{datum} an und Lens liest das Dokument, um die Platzhalter zu füllen. Automatisiere deine Dateiorganisation.

Drei **Ausgabe**-Level

Wähle die Extraktionstiefe, die du brauchst. Von Rohtext bis zum vollständig gestylten, renderbaren Dokument.

md

Standard Markdown

Rohe Textextraktion als sauberes Markdown. Schnell und leichtgewichtig — ideal für Suchindexierung oder Content-Migration.

# Quarterly Report

Revenue grew by **23%**
compared to last quarter.

## Key Metrics

| Metric   | Value |
|----------|-------|
| Revenue  | €1.2M |
| Growth   | 23%   |
mdd

Autype Extended Markdown

Markdown plus vollständige Dokumenteinstellungen, Styling-Defaults, Kopf- und Fußzeilen. Rendere mit dem Original-Look.

---document
size: A4
marginTop: 2.5
marginBottom: 2
---defaults
fontFamily: Inter
fontSize: 11
color: #333333
styles:
  h1:
    color: #1a365d
    fontSize: 24
---
# Quarterly Report

Revenue grew by **23%**
compared to last quarter.
json

Autype Document JSON

Vollständig strukturiertes Dokument mit Sections, Elementen und Styling — bereit zum Import in Autype oder zur programmatischen Verarbeitung.

{
  "defaults": {
    "fontFamily": "Inter",
    "fontSize": 11,
    "styles": {
      "h1": { "color": "#1a365d" }
    }
  },
  "sections": [
    {
      "type": "flow",
      "content": [
        { "type": "h1", "text": "Report" },
        { "type": "text", "text": "Revenue grew by **23%**" }
      ]
    }
  ]
}

Gebaut für echte **Workflows**

Autype Lens passt in Dokumenten-Pipelines, in denen einfaches OCR nicht ausreicht.

Dokumenten-Digitalisierung

Konvertiere gescannte PDFs und Legacy-Dokumente in bearbeitbare, strukturierte Formate — unter Beibehaltung des Original-Layouts und -Designs.

Content-Migration

Verschiebe Dokumente zwischen Systemen, ohne Formatierung zu verlieren. Extrahiere gestylten Inhalt und rendere ihn in Autype oder jeder anderen Plattform.

Automatisierte Ablage

Klassifiziere eingehende Dokumente, extrahiere Schlüsselfelder und generiere Dateinamen automatisch. Baue vollautomatische Dokumenten-Eingangs-Pipelines.

Datenextraktion

Extrahiere strukturierte Daten aus Rechnungen, Verträgen, Berichten und Formularen. Definiere dein Schema einmal und extrahiere über die API im großen Stil.

Ein API-Aufruf **entfernt**

Integriere Lens in deinen Workflow mit einem einfachen REST-API-Aufruf. Lade eine Datei hoch, wähle dein Ausgabeformat und erhalte strukturierte Ergebnisse.

Request
curl -X POST https://api.autype.com/api/v1/dev/tools/lens/ocr \
  -H "X-API-Key: your_api_key" \
  -H "Content-Type: application/json" \
  -d '{
    "fileId": "550e8400-e29b-41d4-a716-446655440000",
    "outputFormat": "mdd"
  }'
Response
{
  "id": "job_abc123",
  "status": "COMPLETED",
  "result": {
    "outputFormat": "mdd",
    "content": "---document\nsize: A4\n---defaults\nfontFamily: Inter\n---\n# Report Title\n\nContent with **styling** preserved..."
  }
}

Verfügbar in Pro- und Team-Plänen. 4 Credits pro Seite.

Bereit, über **OCR** hinauszugehen?

Beginne noch heute, Text, Layout und Styling aus deinen Dokumenten zu extrahieren.