Dans un monde où l'exploitation optimale et rapide des données devient un enjeu vital, les moteurs de recommandations ont acquis un statut particulier et une visibilité indiscutable.

Leur rôle consiste à faire remonter automatiquement la bonne information, dans le contexte adéquat, sans nécessiter de la part du destinataire de connaissances particulières.

Comme nous allons le voir, ce principe assez simple trouve des applications extrêmement variées, de la recommandation de produits e-commerce, à la recommandation sociale, en passant par divers contenus texte et médias.

Le KernixLab travaille depuis de nombreuses années dans le domaine de l'intelligence prédictive et notamment sur l'optimisation et l'amélioration de moteurs de recommandation dans différents contextes.

Dans l'univers des médias, un tel moteur vous permet de proposer aux lecteurs des contenus proches de celui qu'il est en train de consulter. Il s'agit d'un excellent moyen de garder l'internaute sur le site et de maximiser la durée de sa visite. Le site Konbini est un exemple de mise en oeuvre par nos soins d'un tel moteur.

En ce qui concerne l'e-commerce, la recommandation consiste à proposer des produits correspondants aux goûts de l'utilisateur de manière à vendre plus : plus de commandes et des commandes plus importantes, avec in finé un panier moyen plus important. Notre moteur de recommandation fut en mesure d'améliorer de 30% le taux de clic des mails transactionnels de CDiscount.

Le coeur de notre réponse repose sur l'utilisation combinée des graphes (#GraphMining) et du traitement automatique du langage naturel (#TextMining). Cette analyse sémantique nous permet de savoir à tout instant à quel point un contenu textuel est proche d'un autre. Détail important, notre approche statistique nous permet de nous affranchir des contraintes vis à vis des spécificité des langues (aucun besoin de dictionnaires ou de thésaurus).

Nos algorithmes se combinent pour extraire et croiser toutes les informations disponibles, afin d'optimiser au mieux la pertinence de la recommandation.

La participation de Kernix au programme de recherche Investissements d'Avenir (volet Numération du Patrimoine) nous a permis d'aller plus loin dans le domaine de la notion de "proximité" en travaillant sur les fichiers multimédias, en généralisant l'approche précédente.


Ce projet permet à des producteurs de contenus video de gagner du temps dans le traitement de leurs rushs. Il s'agit d'une part d'auto enrichir en métadonnées chacun de ces rushs et de propager ces métadonnées sur les rushs "similaires".

Cette capacité de calculer la proximité entre les plans permet:
  • de trouver les rushs qui ont été utilisés pour réaliser le master
  • d'utiliser une photo pour trouver les rushs similaires (ex. j'envoie une photo de "forêt" pour trouver des videos qui contiennent des plans de "forêts")


L'enrichissement automatique de métadonnées repose sur les outils suivants :
  • video2text : extraire automatique les textes qui apparaissent dans une video
  • speech2text : transcription automatique en texte des flux audios


En plus de ces sujets liés à la proximité, les ingénieurs de Kernix ont développé dans ce cadre un lecteur widget vidéo avancé disposant des fonctionnalités suivantes:
  • 100% JavaScript / HTML5
  • lecture frame à frame
  • lecture accélérée (lecture X fois plus rapides ou affichage d'une frame toute les X frames)
  • affichage des plans et détections de plans similaires (avec des codes couleur)

Kernix a participé à ce projet au côté des sociétés CapitalVision, Gédéon et des labos Etis, et LRDE.