Contexte
Mise à disposition de la communauté scientifique des données radios solaire issues de trois instruments présent sur le site de Nançay.
Objectif
La station de radioastronomie de Nançay conduit des observations de surveillance du Soleil avec trois instruments : un imageur opérant à quelques fréquences choisies et deux spectrographes qui observent le spectre de l’émission éruptive du Soleil sur une gamme de fréquences sans résolution spatiale. Cet ensemble est unique au monde. Il fournit des données pour une communauté scientifique internationale et pour des utilisateurs non scientifiques, intéressés par la météorologie de l’espace. Une base de données est en construction pour donner à cette communauté un accès facile et rapide à des quantités importantes de données.
Une des objectifs de la base de données radio solaire est d’analyser des séries temporelles de ce jeu de données afin d’obtenir des statistiques sur l’activité radio solaire. De telles études sont à l’heure actuelle quasi-inexistantes faute de moyen technique, et les fonctionnalités (e.g., data mining) de la base de données, à la disposition de la communauté nationale et internationale permettront de développer de nouvelles approches pour étudier l’activité solaire.
La solution choisit est la mise en place d’une base de donnée Temporelle dans le framework d’Hadoop, OpenTsDB s’appuie sur Hbase qui lui même utilise les fichiers HDFS d’Hadoop . De plus, l’outil SPARK chapeaute HBASE.
Cette architecture répond aux besoins grandissants d’espace de stockage, à la possibilité d’extraire les données de manière classique mais aussi d’explorer statistiquement les données.