Autype Lens
#Compréhension documentaire par **IA**
Autype Lens va au-delà du simple OCR. Il combine la reconnaissance optique de caractères avec des modèles vision-langage pour extraire non seulement le texte — mais aussi la mise en page, le style et la structure de tout document.
Document en entrée
PDF, DOCX, ODT
Sortie structurée
md / mdd / json
Document en entrée
PDF, DOCX, ODT
Sortie structurée
md / mdd / json
Deux technologies IA, **un** pipeline
L'OCR traditionnel capture le texte mais perd tout le reste. Les modèles vision-langage comprennent les pages visuellement mais manquent de précision. Autype Lens combine les deux en un seul pipeline — construit sur des modèles open source affinés — pour des résultats qu'aucune approche ne pourrait atteindre seule.
Reconnaissance optique de caractères
Extraction de texte précise au niveau des caractères. Nos modèles OCR affinés gèrent les mises en page complexes, les pages multi-colonnes et les tableaux intégrés avec une haute précision — même sur les documents numérisés.
Modèles vision-langage
Compréhension visuelle au niveau de la page. Les VLM affinés analysent la page entière comme une image pour comprendre les hiérarchies de titres, les styles de police, les schémas de couleurs, les marges et les relations spatiales entre les éléments.
Pipeline d'extraction unifié
Le passage OCR fournit un texte précis. Le passage VLM fournit la sémantique du document. Notre pipeline fusionne les deux — validé contre des schémas JSON et réessayé automatiquement si nécessaire — pour un résultat complet et structuré.
Quatre façons de **comprendre** les documents
Autype Lens offre un ensemble d'outils alimentés par l'IA pour différentes tâches de compréhension documentaire — tous accessibles via une seule API REST.
OCR intelligent
Convertissez des documents en Markdown, Autype Extended Markdown (avec style et défauts), ou JSON Autype complet — prêt à éditer ou re-générer. Supporte la sélection de pages.
Classification de documents
Catégorisez automatiquement les documents dans vos catégories personnalisées. Téléchargez un document, fournissez vos labels, et obtenez la meilleure correspondance avec un score de confiance.
Extraction de données structurées
Définissez un schéma de champs et laissez Lens extraire des données structurées de tout document. Numéros de facture, dates, noms, montants — tout ce dont votre flux a besoin.
Génération de noms de fichiers par IA
Fournissez un modèle de nommage comme facture-{numero}-{date} et Lens lit le document pour remplir les espaces réservés. Automatisez l'organisation de vos fichiers.
Trois niveaux de **sortie**
Choisissez la profondeur d'extraction dont vous avez besoin. Du texte brut à un document entièrement stylé et regénérable.
Markdown standard
Extraction de texte brut en Markdown propre. Rapide et léger — idéal pour l'indexation de recherche ou la migration de contenu.
# Quarterly Report Revenue grew by **23%** compared to last quarter. ## Key Metrics | Metric | Value | |----------|-------| | Revenue | €1.2M | | Growth | 23% |
Autype Extended Markdown
Markdown plus paramètres complets du document, défauts de style, en-têtes et pieds de page. Regénérez avec le look original.
---document
size: A4
marginTop: 2.5
marginBottom: 2
---defaults
fontFamily: Inter
fontSize: 11
color: #333333
styles:
h1:
color: #1a365d
fontSize: 24
---
# Quarterly Report
Revenue grew by **23%**
compared to last quarter.Autype Document JSON
Document structuré complet avec sections, éléments et style — prêt à importer dans Autype ou à traiter par programmation.
{
"defaults": {
"fontFamily": "Inter",
"fontSize": 11,
"styles": {
"h1": { "color": "#1a365d" }
}
},
"sections": [
{
"type": "flow",
"content": [
{ "type": "h1", "text": "Report" },
{ "type": "text", "text": "Revenue grew by **23%**" }
]
}
]
}Conçu pour de vrais **workflows**
Autype Lens s'intègre dans les pipelines documentaires où l'OCR brut ne suffit pas.
Numérisation de documents
Convertissez des PDF numérisés et des documents anciens en formats structurés et éditables — en préservant la mise en page et le design originaux.
Migration de contenu
Déplacez des documents entre systèmes sans perdre la mise en forme. Extrayez le contenu stylé et regénérez-le dans Autype ou toute autre plateforme.
Classement automatisé
Classifiez les documents entrants, extrayez les champs clés et générez les noms de fichiers automatiquement. Construisez des pipelines d'entrée de documents entièrement automatiques.
Extraction de données
Extrayez des données structurées de factures, contrats, rapports et formulaires. Définissez votre schéma une fois et extrayez à grande échelle via l'API.
À un appel API **près**
Intégrez Lens dans votre flux avec un simple appel API REST. Téléchargez un fichier, choisissez votre format de sortie et obtenez des résultats structurés.
curl -X POST https://api.autype.com/api/v1/dev/tools/lens/ocr \
-H "X-API-Key: your_api_key" \
-H "Content-Type: application/json" \
-d '{
"fileId": "550e8400-e29b-41d4-a716-446655440000",
"outputFormat": "mdd"
}'{
"id": "job_abc123",
"status": "COMPLETED",
"result": {
"outputFormat": "mdd",
"content": "---document\nsize: A4\n---defaults\nfontFamily: Inter\n---\n# Report Title\n\nContent with **styling** preserved..."
}
}Disponible sur les plans Pro et Team. 4 crédits par page.
Prêt à aller au-delà de l'**OCR** ?
Commencez dès aujourd'hui à extraire texte, mise en page et style de vos documents.
