Découvrez comment travailler avec les images dans ABBYY FineReader Engine afin d'apporter de la plus-value à vos apps à l'occasion du replay d'un webinaire technique 4PARTAGES 9 0 Le kit de développement logiciel ABBYY FineReader Engine permet aux développeurs et aux fournisseurs de logiciels de créer des applications qui peuvent extraire automatiquement des données de texte dans les documents, des captures d’écran et des interfaces machine (formulaires, etc.). Eva Weber, Senior Product Marketing Manager SDK et Stefan Schmainta, Solution Architect, se sont fait les hôtes d’un webinaire technique qui a pour thème « Comment travailler avec les images dans ABBYY FineReader Engine ».



Eva Weber a indiqué aux développeurs et aux fournisseurs de logiciels qu’en intégrant le SDK à leur logiciel, celui-ci se verrait rapidement doté d’une nouvelle plage de fonctionnalités. Vous pouvez par exemple :

Reconnaitre du texte (écrit à la main ou du texte machine) dans plus de 220 langues ;

Classifier des documents ;

Extraire des valeurs de code-barre ;

Extraire des valeurs dans certains champs spécifiques comme les cartes de visite par exemple ou même des cartes nationales d’identité ;

Comparer deux versions d’un document et chercher les éventuelles modifications ;

Etc.



Étant donné que le webinaire est orienté technique, Eva a parlé des étapes de traitement. Au total il y en a six, mais ABBYY a choisi de se concentrer sur la seconde, notamment le prétraitement d’image :





« Il s’agit d’une étape très importante pour une simple raison : plus la qualité de l’image est bonne, plus il sera aisé d’extraire des données véhiculées par l’image, plus nous parvenons à supprimer les distorsions dans le prétraitement d’image, plus précise sera la reconnaissance optique de texte ».



Rendus à ce niveau, c’est Stefan Schmainta qui a pris la parole. Il a parlé de certaines options proposées par ABBYY FineReader Engine pour améliorer la qualité de l’image.



L’amélioration de la qualité d’image concerne également les images prises depuis les dispositifs portables comme les smartphones :



« Nous n’allons pas nous contenter de parler des scans de documents parce qu’il s'agit là d’un seul scénario d’entrée de données. Nous utilisons par exemple nos smartphones tous les jours pour prendre des photos. Alors se servir des caméras de dispositifs portables pour capturer des images peut rendre plus faible la capacité à extraire des données d’une image. Imaginez-vous en train de prendre en photo des pages d’un livre, mais avec un mauvais positionnement de votre caméra. Il y aura donc une distorsion géométrique qui va provoquer un changement dans la taille des caractères, voire la police ».



Un autre problème peut survenir lorsque la personne qui prend des photos a eu les mains tremblantes à ce moment, ce qui rend flous les caractères et réduit également votre capacité à extraire des informations.



Toutes ces situations peuvent être corrigées par le SDK et Stefan Schmainta en a cité plusieurs autres comme des problèmes résultant du bruit ISO.



Par la suite il a montré certaines fonctionnalités en action.



