Pour améliorer sa performance opérationnelle, Squareness souhaitait se doter d’outils en mesure d’automatiser l’extraction d’informations et des tableaux à partir de documents non structurés tels que des fiducies, des baux et des contrats de location et d’emprunt.
Squareness

Client
Squareness
Expertises
- LLM
- OCR
Technos
Python
Fastapi
Opencv
scikit-learn
Torch
Pandas
Année
2024
Contexte
Réalisation
La mission consistait à extraire automatiquement des tableaux et des informations précises à partir de plusieurs types de documents non structurés, au format PDF et image. Pour cela, les étapes suivantes ont été mises en œuvre :
- Développement d’un traitement permettant d’extraire les données textuelles à partir de fichiers PDF, d’images scannées et d’images sans couche OCR.
- Développement d’un traitement dédié à l’identification et à l’extraction des grilles de données (ex. échéanciers).Mise en œuvre d’une solution de détection d’entités nommées adaptée aux différents types de contrats et de baux.
- Génération de résultats intégrant les données extraites via une interface interactive, permettant à l’utilisateur de poser ses propres questions sur les documents, au-delà des informations prédéfinies.
Résultats
L’automatisation de l’extraction des données a entraîné un gain important en efficacité : les collaborateurs peuvent désormais se focaliser sur d’autres tâches.
Par ailleurs, la mise en place d’une interface a rendu la recherche d’informations contractuelles spécifiques grandement simplifiée.