Autype
Autype

Autype Lens

#Compréhension documentaire par IA

Autype Lens va au-delà du simple OCR. Il combine la reconnaissance optique de caractères avec des modèles vision-langage pour extraire le texte, la mise en page, le style et la structure de tout document.

Document en entrée

PDF, DOCX, ODT

Autype Lens
Extraire le contenu
Détecter la mise en page
Identifier le style
Classifier & extraire

Sortie structurée

md / mdd / json

Deux technologies IA, un pipeline

L'OCR traditionnel capture le texte mais perd tout le reste. Les modèles vision-langage comprennent les pages visuellement mais manquent de précision. Autype Lens combine les deux en un seul pipeline (construit sur des modèles open source affinés) pour des résultats qu'aucune approche ne pourrait atteindre seule.

Reconnaissance optique de caractères

Extraction de texte précise au niveau des caractères. Nos modèles OCR affinés gèrent les mises en page complexes, les pages multi-colonnes et les tableaux intégrés avec une haute précision, y compris les documents numérisés.

Modèles vision-langage

Compréhension visuelle au niveau de la page. Les VLM affinés analysent la page entière comme une image pour comprendre les hiérarchies de titres, les styles de police, les schémas de couleurs, les marges et les relations spatiales entre les éléments.

Pipeline d'extraction unifié

Le passage OCR fournit un texte précis. Le passage VLM fournit la sémantique du document. Notre pipeline fusionne les deux, valide la sortie contre des schémas JSON et réessaie automatiquement si nécessaire.

Construit sur des modèles open source affinés
Sortie validée contre des schémas JSON
Réessai automatique avec retour d'erreur

Quatre façons de comprendre les documents

Autype Lens offre un ensemble d'outils alimentés par l'IA pour différentes tâches de compréhension documentaire, tous accessibles via une seule API REST.

Acme Corp
Quarterly Report
Quarterly Report Q4

Revenue grew by 23% compared to last quarter, driven by enterprise adoption and new product launches across all regions.

  • Onboarded 18 new clients
  • Retention rate at 94%
  • 3 new markets planned for Q1
chart-q4.png
Key Metrics
MetricValueChange
Revenue€1.2M+23%
Clients142+18
Margin18%+3%

International expansion is on track with 3 new markets planned for Q1 2025. Operating margins improved to 18%.

Page 1 / 3
Sortie extraite
# Quarterly Report Q4

Revenue grew by **23%** compared to
last quarter, driven by enterprise
adoption across all regions.

Key achievements this quarter:

- Onboarded **18 new clients**
- Retention rate at 94%
- 3 new markets planned for Q1

![Q4 Chart](/output/chart-q4.png)

## Key Metrics

:::table{}headerBg=#f0f0f0 rowAltBg=#fafafa{}
| Metric   | Value  | Change |
|----------|--------|--------|
| Revenue  | €1.2M  | +23%   |
| Clients  | 142    | +18    |
| Margin   | 18%    | +3%    |
:::

Texte, titres, tableaux et structure préservés en Markdown ou JSON.

OCR

OCR intelligent

Convertissez des documents en Markdown, Autype Extended Markdown (avec style et défauts), ou JSON Autype complet. Tous les formats sont prêts à éditer ou regénérer. Supporte la sélection de pages.

Sterling & Associates
Confidential

Service Agreement

This Service Agreement (“Agreement”) is entered into as of March 15, 2025, by and between Sterling & Associates (“Provider”) and Globex Industries (“Client”).

1. Scope of Services

The Provider shall deliver consulting services as described in Exhibit A, including strategic planning, market analysis, and quarterly reviews.

2. Compensation

The Client agrees to pay a monthly retainer of €8,500 for the duration of this Agreement, due within 30 days of invoice.

3. Term & Termination

This Agreement shall commence on the date above and continue for a period of 12 months, unless terminated by either party with 30 days written notice.

Sterling & AssociatesPage 1 of 4
Request
{
  "fileId": "550e8400-...",
  "labels": [
    "contract", "invoice",
    "report", "letter"
  ]
}
Résultat de classification
{
  "category": "contract",
  "confidence": 0.95,
  "labels": [
    { "name": "contract", "score": 0.95 },
    { "name": "letter", "score": 0.03 },
    { "name": "report", "score": 0.02 }
  ]
}

Renvoie la catégorie correspondante avec un score de confiance.

Classifier

Classification de documents

Catégorisez automatiquement les documents dans vos catégories personnalisées. Téléchargez un document, fournissez vos labels, et obtenez la meilleure correspondance avec un score de confiance.

Acme Corp

123 Business St, Munich

INVOICE

INV-2025-0042

Bill to:

Globex Industries

Berlin, Germany

Date: 2025-03-15

Due: 2025-04-15

DescriptionQtyAmount
Consulting Services40h€3,500.00
Travel Expenses1€750.00
Total€4,250.00

All amounts in EUR

Payment terms: 30 days net · IBAN: DE89 3704 0044 0532 0130 00

Acme Corp · VAT ID: DE123456789
Request
{
  "fileId": "550e8400-...",
  "schema": {
    "invoiceNumber": "string",
    "date": "string",
    "vendor": "string",
    "total": "number",
    "currency": "string",
    "lineItems": "array"
  }
}
Champs extraits
{
  "invoiceNumber": "INV-2025-0042",
  "date": "2025-03-15",
  "vendor": "Acme Corp",
  "total": 4250.00,
  "currency": "EUR",
  "lineItems": [
    { "description": "Consulting", "amount": 3500 },
    { "description": "Expenses", "amount": 750 }
  ]
}

JSON structuré avec chaque champ de votre schéma rempli.

Extraire

Extraction de données structurées

Définissez un schéma de champs et laissez Lens extraire des données structurées de tout document. Fonctionne pour les numéros de facture, dates, noms, montants et tout ce dont votre flux a besoin.

35 files

Acme Corp

123 Business St, Munich

INVOICE

INV-2025-0042

Bill to:

Globex Industries

Berlin, Germany

Date: 2025-03-15

Due: 2025-04-15

DescriptionQtyAmount
Consulting Services40h€3,500.00
Travel Expenses1€750.00
Total€4,250.00

Payment terms: 30 days net · IBAN: DE89 3704 0044 0532 0130 00

Acme Corp · VAT ID: DE123456789
Request
{
  "fileId": "550e8400-...",
  "filenameSchema": "invoice-{number}_{date}"
}
Nom de fichier généré
[
  { "fileId": "550e8400-...", "filename": "invoice-INV-2025-0042_2025-03-15" },
  { "fileId": "7a3b1c90-...", "filename": "invoice-INV-2025-0039_2025-03-10" },
  { "fileId": "b2f4e8d1-...", "filename": "invoice-INV-2025-0038_2025-03-08" },
  { "fileId": "c9d5a6f2-...", "filename": "invoice-INV-2025-0035_2025-03-01" },
  { "fileId": "e1a7b3c4-...", "filename": "invoice-INV-2025-0033_2025-02-28" },
  { "fileId": "f8c2d9e5-...", "filename": "invoice-INV-2025-0031_2025-02-25" },
  { "fileId": "a4b6c8d0-...", "filename": "invoice-INV-2025-0029_2025-02-20" },
  { "fileId": "d3e5f7a9-...", "filename": "invoice-INV-2025-0027_2025-02-15" },
  { "fileId": "1b2c3d4e-...", "filename": "invoice-INV-2025-0024_2025-02-10" },
  { "fileId": "5f6a7b8c-...", "filename": "invoice-INV-2025-0021_2025-02-05" },
  ...  // 25 more results
]

Espaces réservés du modèle remplacés par des valeurs lues dans le document.

Nommage

Génération de noms de fichiers par IA

Fournissez un modèle de nommage comme facture-{numero}-{date} et Lens lit le document pour remplir les espaces réservés. Automatisez l'organisation de vos fichiers.

Images incluses dans l'extraction

Lors de l'utilisation de la sortie mdd ou JSON, Lens détecte et extrait toutes les images intégrées du document. Chaque image obtient une URL de téléchargement afin que vous puissiez l'utiliser dans votre pipeline ou la regénérer dans un nouveau document. Aucune étape supplémentaire requise.

image-001.png

Trois niveaux de sortie

Choisissez la profondeur d'extraction dont vous avez besoin. Du texte brut à un document entièrement stylé et regénérable.

md

Markdown standard

Extraction de texte brut en Markdown propre. Rapide, léger et idéal pour l'indexation de recherche ou la migration de contenu.

# Quarterly Report

Revenue grew by **23%**
compared to last quarter.

## Key Metrics

| Metric   | Value |
|----------|-------|
| Revenue  | €1.2M |
| Growth   | 23%   |
mdd

Autype Extended Markdown

Markdown plus paramètres complets du document, défauts de style, en-têtes et pieds de page. Regénérez avec le look original.

---document
size: A4
marginTop: 2.5
marginBottom: 2
---defaults
fontFamily: Inter
fontSize: 11
color: #333333
---
# Quarterly Report

Revenue grew by **23%**
json

Autype Document JSON

Document structuré complet avec sections, éléments et style. Prêt à importer dans Autype ou à traiter par programmation.

{
  "defaults": {
    "fontFamily": "Inter",
    "fontSize": 11
  },
  "sections": [{
    "type": "flow",
    "content": [
      { "type": "h1", "text": "Report" }
    ]
  }]
}

Conçu pour de vrais workflows

Autype Lens s'intègre dans les pipelines documentaires où l'OCR brut ne suffit pas.

Numérisation de documents

Convertissez des PDF numérisés et des documents anciens en formats structurés et éditables. La mise en page et le design originaux sont préservés.

Migration de contenu

Déplacez des documents entre systèmes sans perdre la mise en forme. Extrayez le contenu stylé et regénérez-le dans Autype ou toute autre plateforme.

Classement automatisé

Classifiez les documents entrants, extrayez les champs clés et générez les noms de fichiers automatiquement. Construisez des pipelines d'entrée de documents entièrement automatiques.

Extraction de données

Extrayez des données structurées de factures, contrats, rapports et formulaires. Définissez votre schéma une fois et extrayez à grande échelle via l'API.

À un appel API près

Intégrez Lens dans votre flux avec un simple appel API REST. Téléchargez un fichier, choisissez votre format de sortie et obtenez des résultats structurés.

Request
curl -X POST https://api.autype.com/api/v1/dev/tools/lens/ocr \
  -H "X-API-Key: your_api_key" \
  -H "Content-Type: application/json" \
  -d '{
    "fileId": "550e8400-e29b-41d4-a716-446655440000",
    "outputFormat": "mdd"
  }'
Response
{
  "id": "job_abc123",
  "status": "COMPLETED",
  "result": {
    "outputFormat": "mdd",
    "content": "---document\nsize: A4\n---defaults\nfontFamily: Inter\n---\n# Report Title\n\nContent with **styling** preserved..."
  }
}

Disponible sur tous les plans. 4 crédits par page.

Prêt à aller au-delà de l'OCR ?

Commencez dès aujourd'hui à extraire texte, mise en page et style de vos documents.