Contexte : OSIRIM est un projet fédératif de l’IRIT conduit par les équipes de recherche SAMOVA, SIG, et IRIS et principalement soutenu par le FEDER, le CNRS, le gouvernement Français, et la région Midi-Pyrénées. Le but est de proposer un environnement homogène pour la recherche sur l’indexation et la recherche d’information dans des contenus multimédias. Cela correspond pour l’essentiel à la mise en place d’une architecture matérielle et logicielle permettant de construire, tester et évaluer facilement des chaînes plus ou moins complexes d’outils visant à étiqueter et à retrouver des contenus textuels, audio ou vidéo.
Objectifs : Les principaux objectifs d’OSIRIM sont :
Héberger des projets scientifiques nécessitant le stockage et le partage de plusieurs téraoctets de données pour réaliser des expérimentations sur de grands volumes,
Partager des outils logiciels, par exemple pour l’évaluation de technologies,
Partager des corpus de référence.
Résultats : Déploiement d’une offre de services adaptée aux traitements distribués sur de gros volumes de données (Slurm, Hadoop, Spark, MongoDB, …), hébergement de projets d’équipes de recherche de l’IRIT et de partenaires extérieurs, dans le domaine de l’indexation et la recherche d’informations multimédia, analyse de corpora textuels et ontologies, analyse du comportement des utilisateurs dans les réseaux sociaux, Meta mining pour la recommandation en biosanté, partitionnement de données issues du domaine de la cosmologie, campagnes d’évaluations TREC, …
Conclusion : Osirim est une plateforme matérielle et logicielle opérationnelle, ouverte aux chercheurs et étudiants de l’IRIT travaillant sur des sujets liés au traitement de grands volumes de données, et de façon plus large à des partenaires extérieurs, à la communauté informatique et autres domaines scientifiques souhaitant utiliser ses moyens matériels ou logiciels.