Ce projet répond à la problématique de l'automatisation de la saisie de données pour les documents d'identité et factures. Contrairement à un OCR classique qui se contente de lire du texte, cette solution 'comprend' le document grâce aux modèles multimodaux.
02. Architecture Technique
Frontend : Streamlit pour l'interface de batch upload.
Moteur Vision : Llama 4 Scout via Groq API (Inférence ultra-rapide).
Fallback OCR : EasyOCR pour l'extraction de texte brut en cas de basse résolution.
Validation : Schémas JSON stricts pour garantir la structure des données.
Schéma d'architecture système
03. Fonctionnalités & Valeur Ajoutée
Traitement par lots (Batch processing) de multiples fichiers.
Correction automatique des erreurs de lecture via LLM.