RETOUR AU TERMINAL
Case Study

IDP GenAI Project

VIEW ON GITHUB

01. Contexte du projet

Ce projet répond à la problématique de l'automatisation de la saisie de données pour les documents d'identité et factures. Contrairement à un OCR classique qui se contente de lire du texte, cette solution 'comprend' le document grâce aux modèles multimodaux.

02. Architecture Technique

  • Frontend : Streamlit pour l'interface de batch upload.
  • Moteur Vision : Llama 4 Scout via Groq API (Inférence ultra-rapide).
  • Fallback OCR : EasyOCR pour l'extraction de texte brut en cas de basse résolution.
  • Validation : Schémas JSON stricts pour garantir la structure des données.
Schéma d'architecture

Schéma d'architecture système

03. Fonctionnalités & Valeur Ajoutée

Traitement par lots (Batch processing) de multiples fichiers.
Correction automatique des erreurs de lecture via LLM.
Export direct en JSON structuré.
Interface de prévisualisation des documents.

04. Captures d'écran & Démo

Step 1
Step 2
Step 3