Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Webinaires sur les technologies derrière la Digital Intelligence :
ABBYY va donner une introduction à l'interface de vérification dans le Machine Learning ce 28 avril à 14H00 CEST

Le , par Stéphane le calme

74PARTAGES

4  1 
ABBYY a préparé une série de webinaires à l’intention des développeurs pour les familiariser avec les technologies derrière la Digital Intelligence. Le premier, qui a eu lieu le 9 avril, était une introduction au NPL (Natural Language Processing, ou traitement automatique du langage naturel) et au Machine Learning. Le second, qui a eu lieu le jeudi 16 avril 2020 à 14H00 CEST, a proposé une introduction à la classification automatique. Cette fois-ci, ABBYY propose une introduction à l’interface de vérification et de Machine Learning.

L'apprentissage automatique (ou Machine Learning - ML) est un terme général qui englobe une large classe d'algorithmes qui s'appuient sur les données. Ceci est utile dans les applications où l'algorithme est nécessaire pour s'adapter à de nouvelles situations en cours de fonctionnement, ou lorsqu'il serait trop compliqué d'écrire à la main la fonctionnalité exprimée par l'algorithme. Avec l’utilisation de plus en plus répandue du big data due à de meilleurs matériels et à Internet, les algorithmes d'apprentissage automatique qui peuvent utiliser ces données sont également devenus plus populaires. Ils peuvent être trouvés dans un large éventail d'applications, du filtrage des stocks de spam à la négociation par actions, et le domaine continue de croître. Les spécialistes estiment qu’à l'avenir, cette discipline devrait nous guider vers un monde d'autonomie avec des systèmes cyber-physiques contrôlés par l’apprentissage automatique qui pourront remplacer les conducteurs (voitures autonomes), les pilotes et plus encore.

Il faut noter que l’apprentissage automatique ne se résume pas à un ensemble d'algorithmes mais suit une succession d'étapes :
  • L'acquisition de données : l'algorithme se nourrissant des données en entrée, c'est une étape importante. Il en va de la réussite du projet, de récolter des données pertinentes et en quantité suffisante.
  • La préparation et le nettoyage de la donnée : les données recueillies doivent être retouchées avant utilisation. En effet, certains attributs sont inutiles, d’autres doivent être modifiés afin d’être compris par l’algorithme, et certains éléments sont inutilisables car leurs données sont incomplètes. Plusieurs techniques telles que la visualisation de données, la transformation de données ou encore la normalisation sont alors employées.
  • La création du modèle.
  • L'évaluation : une fois l'algorithme d'apprentissage automatique entraîné sur un premier jeu de données, on l'évalue sur un deuxième ensemble de données afin de vérifier que le modèle ne fasse pas de surapprentissage.
  • Le déploiement : le modèle est déployé en production pour faire des prédictions, et potentiellement utiliser les nouvelles données en entrée pour se ré-entraîner et être amélioré.



Alors que les tests traditionnels peuvent être suffisants pour des logiciels plus conventionnels, ils sont insuffisants pour les logiciels d'IA complexes, principalement parce que la gamme de situations à tester est incomparablement plus grande. Un programme intelligent typique incorpore implicitement des réponses à un très grand espace d'entrées possibles. L'état interne du programme est généralement énorme, alloué dynamiquement et peut impliquer des structures de données complexes (connaissances, règles, théories). Les systèmes d'IA peuvent impliquer plusieurs composants simultanés, ou d'autres sources de non-déterminisme. En raison de tous ces facteurs, une suite de tests ne peut exercer qu'une partie très limitée des configurations possibles, et il est très difficile d'évaluer combien a été découvert et donc de mesurer le risque résiduel d'erreurs.

En clair, le problème central de la vérification logicielle est de vérifier qu'un système donné satisfait ses spécifications. Les techniques conventionnelles s’appuient sur des tests approfondis. La faiblesse de baser uniquement la vérification sur les tests est que « les tests de programme peuvent être utilisés pour montrer la présence de bogues, mais jamais pour montrer leur absence ». De plus en plus, les techniques de vérification basées sur des méthodes formelles sont acceptées dans l'industrie.

Bien entendu, des exemples concrets seraient beaucoup plus illustratifs. Aussi, ABBYY propose de donner une introduction à l’interface de vérification de Machine Learning. L’éditeur invite les développeurs ce mardi 28 avril 2020 à 14H dans son webinaire qui sera consacré à cette étape dans le projet d’apprentissage automatique : « venez découvrir l’interface utilisateur ABBYY et l’ensemble de ses fonctionnalités ». La participation au webinaire est gratuite.

S'inscrire gratuitement

Regarder le replay des sessions précédentes :

Introduction au traitement automatique du langage naturel et au Machine Learning
Introduction à la classification automatique
Introduction à l'extraction de données

Une erreur dans cette actualité ? Signalez-le nous !