Le projet ROCKFlows vise à jeter les bases d’une ligne de produit logiciel (SPL) qui guide la construction d’un workflow de Machine Learning (ML). Selon ses données et ses objectifs, l’utilisateur final, qui n’est pas nécessairement un expert, reçoit alors les propositions de la SPL répondant à ses besoins de la « meilleure façon possible ». Pour rendre une telle plate-forme durable, les data scientists doivent pouvoir intégrer de nouveaux algorithmes qui pourront alors être comparés à ceux qui existent déjà dans le système, permettant ainsi d’augmenter l’espace des solutions disponibles. Bien que la comparaison d’algorithmes soit un défi en soi, le Machine Learning, qui est un vaste domaine en constante évolution et extrêmement complexe, nécessite la définition de mécanismes d’évolution spécifiques et flexibles. Dans ce projet, nous nous concentrons sur les mécanismes basés sur des techniques de méta-modèles afin d’enrichir automatiquement une SPL tout en assurant sa cohérence et en explorant une large gamme d’algorithmes de Machine Learning pour générer des connaissances métiers accessibles et généralisables à partir de ROCKFlows.
Il existe des solutions industrielles offertes sur le cloud (e.g., IBM’s Watson Analytics, AmazonMachine Learning, Google’s Prediction API) qui permettent d’extraire de la connaissance des données sans se préoccuper des pre-processing et des algorithmes de ML. D’autres acteurs comme Microsoft avec la plateforme Azure’s Machine Learning permettent de construire un Workflow au travers d’un éditeur graphique et ciblent des data scientits. Le point commun entre ces solutions est qu’elles ne permettent pas de choisir parmi les centaines d’algorithmes existants alors que de nouveaux algorithmes sont régulièrement proposés. La démonstration proposée montre les bases de la SPL de la saisie des objectifs à la génération des workflows.
L’interface web en cours de construction se trouve ici : http://rockflows.i3s.unice.fr/
Le site devrait avoir fortement évolué, entre autre par l’introduction de nouveaux algorithmes, d’ici le 8 octobre.