Autype Lens
#Compréhension documentaire par IA
Autype Lens va au-delà du simple OCR. Il combine la reconnaissance optique de caractères avec des modèles vision-langage pour extraire le texte, la mise en page, le style et la structure de tout document.
Document en entrée
PDF, DOCX, ODT
Sortie structurée
md / mdd / json
Document en entrée
PDF, DOCX, ODT
Sortie structurée
md / mdd / json
Deux technologies IA, un pipeline
L'OCR traditionnel capture le texte mais perd tout le reste. Les modèles vision-langage comprennent les pages visuellement mais manquent de précision. Autype Lens combine les deux en un seul pipeline (construit sur des modèles open source affinés) pour des résultats qu'aucune approche ne pourrait atteindre seule.
Reconnaissance optique de caractères
Extraction de texte précise au niveau des caractères. Nos modèles OCR affinés gèrent les mises en page complexes, les pages multi-colonnes et les tableaux intégrés avec une haute précision, y compris les documents numérisés.
Modèles vision-langage
Compréhension visuelle au niveau de la page. Les VLM affinés analysent la page entière comme une image pour comprendre les hiérarchies de titres, les styles de police, les schémas de couleurs, les marges et les relations spatiales entre les éléments.
Pipeline d'extraction unifié
Le passage OCR fournit un texte précis. Le passage VLM fournit la sémantique du document. Notre pipeline fusionne les deux, valide la sortie contre des schémas JSON et réessaie automatiquement si nécessaire.
Quatre façons de comprendre les documents
Autype Lens offre un ensemble d'outils alimentés par l'IA pour différentes tâches de compréhension documentaire, tous accessibles via une seule API REST.
Revenue grew by 23% compared to last quarter, driven by enterprise adoption and new product launches across all regions.
- ●Onboarded 18 new clients
- ●Retention rate at 94%
- ●3 new markets planned for Q1
International expansion is on track with 3 new markets planned for Q1 2025. Operating margins improved to 18%.
# Quarterly Report Q4 Revenue grew by **23%** compared to last quarter, driven by enterprise adoption across all regions. Key achievements this quarter: - Onboarded **18 new clients** - Retention rate at 94% - 3 new markets planned for Q1  ## Key Metrics :::table{}headerBg=#f0f0f0 rowAltBg=#fafafa{} | Metric | Value | Change | |----------|--------|--------| | Revenue | €1.2M | +23% | | Clients | 142 | +18 | | Margin | 18% | +3% | :::
Texte, titres, tableaux et structure préservés en Markdown ou JSON.
OCR intelligent
Convertissez des documents en Markdown, Autype Extended Markdown (avec style et défauts), ou JSON Autype complet. Tous les formats sont prêts à éditer ou regénérer. Supporte la sélection de pages.
Service Agreement
This Service Agreement (“Agreement”) is entered into as of March 15, 2025, by and between Sterling & Associates (“Provider”) and Globex Industries (“Client”).
1. Scope of Services
The Provider shall deliver consulting services as described in Exhibit A, including strategic planning, market analysis, and quarterly reviews.
2. Compensation
The Client agrees to pay a monthly retainer of €8,500 for the duration of this Agreement, due within 30 days of invoice.
3. Term & Termination
This Agreement shall commence on the date above and continue for a period of 12 months, unless terminated by either party with 30 days written notice.
{ "fileId": "550e8400-...", "labels": [ "contract", "invoice", "report", "letter" ] }
{ "category": "contract", "confidence": 0.95, "labels": [ { "name": "contract", "score": 0.95 }, { "name": "letter", "score": 0.03 }, { "name": "report", "score": 0.02 } ] }
Renvoie la catégorie correspondante avec un score de confiance.
Classification de documents
Catégorisez automatiquement les documents dans vos catégories personnalisées. Téléchargez un document, fournissez vos labels, et obtenez la meilleure correspondance avec un score de confiance.
Acme Corp
123 Business St, Munich
INVOICE
INV-2025-0042
Bill to:
Globex Industries
Berlin, Germany
Date: 2025-03-15
Due: 2025-04-15
All amounts in EUR
Payment terms: 30 days net · IBAN: DE89 3704 0044 0532 0130 00
{ "fileId": "550e8400-...", "schema": { "invoiceNumber": "string", "date": "string", "vendor": "string", "total": "number", "currency": "string", "lineItems": "array" } }
{ "invoiceNumber": "INV-2025-0042", "date": "2025-03-15", "vendor": "Acme Corp", "total": 4250.00, "currency": "EUR", "lineItems": [ { "description": "Consulting", "amount": 3500 }, { "description": "Expenses", "amount": 750 } ] }
JSON structuré avec chaque champ de votre schéma rempli.
Extraction de données structurées
Définissez un schéma de champs et laissez Lens extraire des données structurées de tout document. Fonctionne pour les numéros de facture, dates, noms, montants et tout ce dont votre flux a besoin.
Acme Corp
123 Business St, Munich
INVOICE
INV-2025-0042
Bill to:
Globex Industries
Berlin, Germany
Date: 2025-03-15
Due: 2025-04-15
Payment terms: 30 days net · IBAN: DE89 3704 0044 0532 0130 00
{ "fileId": "550e8400-...", "filenameSchema": "invoice-{number}_{date}" }
[ { "fileId": "550e8400-...", "filename": "invoice-INV-2025-0042_2025-03-15" }, { "fileId": "7a3b1c90-...", "filename": "invoice-INV-2025-0039_2025-03-10" }, { "fileId": "b2f4e8d1-...", "filename": "invoice-INV-2025-0038_2025-03-08" }, { "fileId": "c9d5a6f2-...", "filename": "invoice-INV-2025-0035_2025-03-01" }, { "fileId": "e1a7b3c4-...", "filename": "invoice-INV-2025-0033_2025-02-28" }, { "fileId": "f8c2d9e5-...", "filename": "invoice-INV-2025-0031_2025-02-25" }, { "fileId": "a4b6c8d0-...", "filename": "invoice-INV-2025-0029_2025-02-20" }, { "fileId": "d3e5f7a9-...", "filename": "invoice-INV-2025-0027_2025-02-15" }, { "fileId": "1b2c3d4e-...", "filename": "invoice-INV-2025-0024_2025-02-10" }, { "fileId": "5f6a7b8c-...", "filename": "invoice-INV-2025-0021_2025-02-05" }, ... // 25 more results ]
Espaces réservés du modèle remplacés par des valeurs lues dans le document.
Génération de noms de fichiers par IA
Fournissez un modèle de nommage comme facture-{numero}-{date} et Lens lit le document pour remplir les espaces réservés. Automatisez l'organisation de vos fichiers.
Images incluses dans l'extraction
Lors de l'utilisation de la sortie mdd ou JSON, Lens détecte et extrait toutes les images intégrées du document. Chaque image obtient une URL de téléchargement afin que vous puissiez l'utiliser dans votre pipeline ou la regénérer dans un nouveau document. Aucune étape supplémentaire requise.
Trois niveaux de sortie
Choisissez la profondeur d'extraction dont vous avez besoin. Du texte brut à un document entièrement stylé et regénérable.
Markdown standard
Extraction de texte brut en Markdown propre. Rapide, léger et idéal pour l'indexation de recherche ou la migration de contenu.
# Quarterly Report Revenue grew by **23%** compared to last quarter. ## Key Metrics | Metric | Value | |----------|-------| | Revenue | €1.2M | | Growth | 23% |
Autype Extended Markdown
Markdown plus paramètres complets du document, défauts de style, en-têtes et pieds de page. Regénérez avec le look original.
---document size: A4 marginTop: 2.5 marginBottom: 2 ---defaults fontFamily: Inter fontSize: 11 color: #333333 --- # Quarterly Report Revenue grew by **23%**
Autype Document JSON
Document structuré complet avec sections, éléments et style. Prêt à importer dans Autype ou à traiter par programmation.
{ "defaults": { "fontFamily": "Inter", "fontSize": 11 }, "sections": [{ "type": "flow", "content": [ { "type": "h1", "text": "Report" } ] }] }
Conçu pour de vrais workflows
Autype Lens s'intègre dans les pipelines documentaires où l'OCR brut ne suffit pas.
Numérisation de documents
Convertissez des PDF numérisés et des documents anciens en formats structurés et éditables. La mise en page et le design originaux sont préservés.
Migration de contenu
Déplacez des documents entre systèmes sans perdre la mise en forme. Extrayez le contenu stylé et regénérez-le dans Autype ou toute autre plateforme.
Classement automatisé
Classifiez les documents entrants, extrayez les champs clés et générez les noms de fichiers automatiquement. Construisez des pipelines d'entrée de documents entièrement automatiques.
Extraction de données
Extrayez des données structurées de factures, contrats, rapports et formulaires. Définissez votre schéma une fois et extrayez à grande échelle via l'API.
À un appel API près
Intégrez Lens dans votre flux avec un simple appel API REST. Téléchargez un fichier, choisissez votre format de sortie et obtenez des résultats structurés.
curl -X POST https://api.autype.com/api/v1/dev/tools/lens/ocr \ -H "X-API-Key: your_api_key" \ -H "Content-Type: application/json" \ -d '{ "fileId": "550e8400-e29b-41d4-a716-446655440000", "outputFormat": "mdd" }'
{ "id": "job_abc123", "status": "COMPLETED", "result": { "outputFormat": "mdd", "content": "---document\nsize: A4\n---defaults\nfontFamily: Inter\n---\n# Report Title\n\nContent with **styling** preserved..." } }
Disponible sur tous les plans. 4 crédits par page.
Prêt à aller au-delà de l'OCR ?
Commencez dès aujourd'hui à extraire texte, mise en page et style de vos documents.
