Le département R&D Screening des laboratoires Servier cherche à identifier des molécules aux propriétés nouvelles, biologiquement actives. Le criblage consiste à réaliser des tests cellulaires biochimiques pour identifier de telles molécules, cependant le nombre de molécules à tester est trop important pour réaliser ces tests dans un budget et un temps raisonnable. En effet, quelques centaines de milliers de molécules sont répertoriées dans les bases de données du laboratoire.
Le projet consistait donc à optimiser le choix des molécules à tester par un moyen beaucoup moins coûteux : le deep learning sur des caractéristiques phénotypiques de l’activité des molécules (exemple : photos prises au microscope après une réaction).