Les projets Tara Oceans et Tara Polar Circle ont consisté en une collecte d’échantillons marins, entre 2009 et 2013, et dans tous les océans du globe, afin d’étudier, notamment via des approches de génomique à haut débit, les organismes planctoniques (≤ 2 mm). Plus de 1 Pbp de données de séquence ont déjà été générées (soit plus de 10,000 équivalents génome humain), représentant plus de 500 To d’espace disque.
Afin de permettre l’interprétation de ces données, plus de 25 millions d’heures de calcul ont été effectuées sur les infrastructures de France Génomique et du Très Grand Centre de Calcul du CEA.
L’accroissement effréné des capacités de séquençage implique un usage intensif d’infrastructures de calcul à haut débit (HTC) ainsi que le développement d’algorithmes d’analyse novateurs et performants, afin de pouvoir faire face à ce déluge de données.