Autype Lens
#KI-gestütztes Dokumentenverständnis
Autype Lens geht über einfaches OCR hinaus. Es kombiniert Texterkennung mit Vision-Language-Modellen, um Text, Layout, Styling und Struktur aus jedem Dokument zu extrahieren.
Dokument-Eingabe
PDF, DOCX, ODT
Strukturierte Ausgabe
md / mdd / json
Dokument-Eingabe
PDF, DOCX, ODT
Strukturierte Ausgabe
md / mdd / json
Zwei KI-Technologien, eine Pipeline
Herkömmliches OCR erfasst Text, verliert aber alles andere. Vision-Language-Modelle verstehen Seiten visuell, haben aber Präzisionsprobleme. Autype Lens kombiniert beides in einer einzigen Pipeline (aufgebaut auf feinjustierten Open-Source-Modellen) für Ergebnisse, die keiner der Ansätze allein liefern könnte.
Optische Zeichenerkennung
Präzise Textextraktion auf Zeichenebene. Unsere feinjustierten OCR-Modelle verarbeiten komplexe Layouts, mehrspaltige Seiten und eingebettete Tabellen mit hoher Genauigkeit, auch bei gescannten Dokumenten.
Vision-Language-Modelle
Visuelles Verständnis auf Seitenebene. Feinjustierte VLMs analysieren die gesamte Seite als Bild, um Überschriftshierarchien, Schriftstile, Farbschemata, Abstände und räumliche Beziehungen zwischen Elementen zu erkennen.
Vereinte Extraktions-Pipeline
Der OCR-Durchlauf liefert präzisen Text. Der VLM-Durchlauf liefert Dokumentsemantik. Unsere Pipeline vereint beides, validiert die Ausgabe gegen JSON-Schemas und wiederholt bei Bedarf automatisch.
Vier Wege, Dokumente zu verstehen
Jede Operation zielt auf eine andere Dokumentenverständnis-Aufgabe ab. Alle sind über einen einzigen REST-API-Endpunkt zugänglich.
Revenue grew by 23% compared to last quarter, driven by enterprise adoption and new product launches across all regions.
- ●Onboarded 18 new clients
- ●Retention rate at 94%
- ●3 new markets planned for Q1
International expansion is on track with 3 new markets planned for Q1 2025. Operating margins improved to 18%.
# Quarterly Report Q4 Revenue grew by **23%** compared to last quarter, driven by enterprise adoption across all regions. Key achievements this quarter: - Onboarded **18 new clients** - Retention rate at 94% - 3 new markets planned for Q1  ## Key Metrics :::table{}headerBg=#f0f0f0 rowAltBg=#fafafa{} | Metric | Value | Change | |----------|--------|--------| | Revenue | €1.2M | +23% | | Clients | 142 | +18 | | Margin | 18% | +3% | :::
Text, Überschriften, Tabellen und Struktur als Markdown oder JSON erhalten.
Intelligentes OCR
Konvertiere Dokumente in Markdown, Autype Extended Markdown (mit Styling & Defaults) oder vollständiges Autype JSON. Alle Formate sind sofort editier- und renderbar. Unterstützt Seitenauswahl.
Service Agreement
This Service Agreement (“Agreement”) is entered into as of March 15, 2025, by and between Sterling & Associates (“Provider”) and Globex Industries (“Client”).
1. Scope of Services
The Provider shall deliver consulting services as described in Exhibit A, including strategic planning, market analysis, and quarterly reviews.
2. Compensation
The Client agrees to pay a monthly retainer of €8,500 for the duration of this Agreement, due within 30 days of invoice.
3. Term & Termination
This Agreement shall commence on the date above and continue for a period of 12 months, unless terminated by either party with 30 days written notice.
{ "fileId": "550e8400-...", "labels": [ "contract", "invoice", "report", "letter" ] }
{ "category": "contract", "confidence": 0.95, "labels": [ { "name": "contract", "score": 0.95 }, { "name": "letter", "score": 0.03 }, { "name": "report", "score": 0.02 } ] }
Gibt die passende Kategorie mit Konfidenzwert zurück.
Dokumentenklassifizierung
Kategorisiere Dokumente automatisch in deine eigenen Kategorien. Lade ein Dokument hoch, gib deine Labels an und erhalte die beste Übereinstimmung mit Konfidenzwert.
Acme Corp
123 Business St, Munich
INVOICE
INV-2025-0042
Bill to:
Globex Industries
Berlin, Germany
Date: 2025-03-15
Due: 2025-04-15
All amounts in EUR
Payment terms: 30 days net · IBAN: DE89 3704 0044 0532 0130 00
{ "fileId": "550e8400-...", "schema": { "invoiceNumber": "string", "date": "string", "vendor": "string", "total": "number", "currency": "string", "lineItems": "array" } }
{ "invoiceNumber": "INV-2025-0042", "date": "2025-03-15", "vendor": "Acme Corp", "total": 4250.00, "currency": "EUR", "lineItems": [ { "description": "Consulting", "amount": 3500 }, { "description": "Expenses", "amount": 750 } ] }
Strukturiertes JSON mit jedem Feld aus deinem Schema ausgefüllt.
Strukturierte Datenextraktion
Definiere ein Feld-Schema und lass Lens strukturierte Daten aus jedem Dokument extrahieren. Funktioniert für Rechnungsnummern, Daten, Namen, Beträge und alles andere, was dein Workflow braucht.
Acme Corp
123 Business St, Munich
INVOICE
INV-2025-0042
Bill to:
Globex Industries
Berlin, Germany
Date: 2025-03-15
Due: 2025-04-15
Payment terms: 30 days net · IBAN: DE89 3704 0044 0532 0130 00
{ "fileId": "550e8400-...", "filenameSchema": "invoice-{number}_{date}" }
[ { "fileId": "550e8400-...", "filename": "invoice-INV-2025-0042_2025-03-15" }, { "fileId": "7a3b1c90-...", "filename": "invoice-INV-2025-0039_2025-03-10" }, { "fileId": "b2f4e8d1-...", "filename": "invoice-INV-2025-0038_2025-03-08" }, { "fileId": "c9d5a6f2-...", "filename": "invoice-INV-2025-0035_2025-03-01" }, { "fileId": "e1a7b3c4-...", "filename": "invoice-INV-2025-0033_2025-02-28" }, { "fileId": "f8c2d9e5-...", "filename": "invoice-INV-2025-0031_2025-02-25" }, { "fileId": "a4b6c8d0-...", "filename": "invoice-INV-2025-0029_2025-02-20" }, { "fileId": "d3e5f7a9-...", "filename": "invoice-INV-2025-0027_2025-02-15" }, { "fileId": "1b2c3d4e-...", "filename": "invoice-INV-2025-0024_2025-02-10" }, { "fileId": "5f6a7b8c-...", "filename": "invoice-INV-2025-0021_2025-02-05" }, ... // 25 more results ]
Muster-Platzhalter ersetzt mit Werten aus dem Dokument.
KI-Dateinamen-Generierung
Gib ein Benennungsmuster wie rechnung-{nummer}-{datum} an und Lens liest das Dokument, um die Platzhalter zu füllen. Automatisiere deine Dateiorganisation.
Bilder inklusive bei der Extraktion
Bei mdd- oder JSON-Ausgabe erkennt und extrahiert Lens alle eingebetteten Bilder aus dem Dokument. Jedes Bild erhält eine Download-URL, sodass du es in deiner Pipeline verwenden oder in einem neuen Dokument rendern kannst. Kein zusätzlicher Schritt nötig.
Drei Ausgabe-Level
Wähle die Extraktionstiefe, die du brauchst. Von Rohtext bis zum vollständig gestylten, renderbaren Dokument.
Standard Markdown
Rohe Textextraktion als sauberes Markdown. Schnell, leichtgewichtig und ideal für Suchindexierung oder Content-Migration.
# Quarterly Report Revenue grew by **23%** compared to last quarter. ## Key Metrics | Metric | Value | |----------|-------| | Revenue | €1.2M | | Growth | 23% |
Autype Extended Markdown
Markdown plus vollständige Dokumenteinstellungen, Styling-Defaults, Kopf- und Fußzeilen. Rendere mit dem Original-Look.
---document size: A4 marginTop: 2.5 marginBottom: 2 ---defaults fontFamily: Inter fontSize: 11 color: #333333 --- # Quarterly Report Revenue grew by **23%**
Autype Document JSON
Vollständig strukturiertes Dokument mit Sections, Elementen und Styling. Bereit zum Import in Autype oder zur programmatischen Verarbeitung.
{ "defaults": { "fontFamily": "Inter", "fontSize": 11 }, "sections": [{ "type": "flow", "content": [ { "type": "h1", "text": "Report" } ] }] }
Gebaut für echte Workflows
Autype Lens passt in Dokumenten-Pipelines, in denen einfaches OCR nicht ausreicht.
Dokumenten-Digitalisierung
Konvertiere gescannte PDFs und Legacy-Dokumente in bearbeitbare, strukturierte Formate. Das Original-Layout und -Design bleiben erhalten.
Content-Migration
Verschiebe Dokumente zwischen Systemen, ohne Formatierung zu verlieren. Extrahiere gestylten Inhalt und rendere ihn in Autype oder jeder anderen Plattform.
Automatisierte Ablage
Klassifiziere eingehende Dokumente, extrahiere Schlüsselfelder und generiere Dateinamen automatisch. Baue vollautomatische Dokumenten-Eingangs-Pipelines.
Datenextraktion
Extrahiere strukturierte Daten aus Rechnungen, Verträgen, Berichten und Formularen. Definiere dein Schema einmal und extrahiere über die API im großen Stil.
Ein API-Aufruf entfernt
Integriere Lens in deinen Workflow mit einem einfachen REST-API-Aufruf. Lade eine Datei hoch, wähle dein Ausgabeformat und erhalte strukturierte Ergebnisse.
curl -X POST https://api.autype.com/api/v1/dev/tools/lens/ocr \ -H "X-API-Key: your_api_key" \ -H "Content-Type: application/json" \ -d '{ "fileId": "550e8400-e29b-41d4-a716-446655440000", "outputFormat": "mdd" }'
{ "id": "job_abc123", "status": "COMPLETED", "result": { "outputFormat": "mdd", "content": "---document\nsize: A4\n---defaults\nfontFamily: Inter\n---\n# Report Title\n\nContent with **styling** preserved..." } }
Verfügbar in allen Plänen. 4 Credits pro Seite.
Bereit, über OCR hinauszugehen?
Beginne noch heute, Text, Layout und Styling aus deinen Dokumenten zu extrahieren.
