Accueil > Mastodons > Gaia, validation

Gaia, validation

Une des caractéristiques de la mission Gaia est l’absence de période de données propriétaires. Le seul avantage dont pourront alors bénéficier les groupes impliqués depuis plusieurs années dans la préparation de la mission est leur connaissance intime des données produites, facilitant une interprétation plus rapide sitôt les premiers résultats publiés. Il semble évident que si la communauté française veut tirer un avantage de sa forte participation à la préparation de ce projet, elle doit également anticiper l’arrivée des données avec un niveau de préparation à l’exploitation scientifique au moins égal à celui des Instituts qui ne se sont pas autant impliqués dans le segment sol. Ceci implique de développer en amont des étapes de modélisation théorique dans plusieurs domaines et des nouvelles techniques d’analyse (par ex. des outils d’analyse multidimensionnelle) et d’obtenir des observations complémentaires.

Dans le même temps, la meilleure forme de préparation à l’arrivée des données consiste bien à travailler sur leur contenu, et nous proposons pour ce faire de contribuer à la validation du futur Catalogue dans le cadre de la CU9. La préparation à la publication de l’archive Gaia requiert en effet une validation détaillée et en profondeur de son contenu.

Cependant, le défi scientifique et statistique de cette tâche sur un ensemble de données de plus d’un milliard d’objets et représentant une si grande variété de données pour chacun (astrométriques, photométriques, spectrophotométriques, spectroscopiques, ...) est de taille, et d’ailleurs impossible sans outils adaptés pour travailler sur une telle masse de données.

Le présent projet vise donc à produire de tels outils, basés sur les besoins de validation mais aussi sur les caractéristiques du système d’archivage, ce qui rendra plus efficaces ces outils. En outre, le processus de validation reposera sur des méthodes et des outils qui peuvent également être appliqués, avec peu (voire aucune) adaptation, à l’analyse scientifique du catalogue. En clair, notre but sera également de produire des outils à destination de la communauté scientifique pour son analyse des données Gaia.

Dans le cadre de cet appel à manifestation d’intérêt MASTODONS, notre proposition concerne directement les axes de recherche suivants, qui représentent autant de verrous technologiques :

  • recherche et visualisation rapide et multidimensionnelle de grandes masses de données
  • en terme de gestion d’une BD d’un grand volume, exploration rapide de toutes les données spatialement,
    par date, toutes les données d’objets particuliers, ou une classe d’objets et combinaisons possibles
  • analyse sur des données contenant des incertitudes de mesure : observationnel et modèle
  • approche multidimensionnelle ; approches paramétriques / non paramétriques ; modèles non linéaires
  • inversion de grandes masses de données ; test de modèles et détermination de paramètres
  • calcul intensif sur des grandes masses de données
  • outils autonomes de qualité des données (validation)
  • interopérabilité et Observatoire Virtuel

Il faut, pour répondre à ces problématiques, mener une approche pluri- et interdisciplinaire. Nous avons déjà réfléchi, dans un autre cadre, à quelques actions orientées astronomie au niveau européen mais il paraît évident qu’il est indispensable de mettre en place des collaborations entre les domaines de l’informatique (BD, datamining) et les mathématiques et statistiques pour permettre de résoudre les problèmes considérables posés par l’exploitation des données Gaia. Cette réponse à l’appel à manifestation d’intérêt vise donc à formaliser un Consortium interdisciplinaire amenant à des solutions originales qui ne sont pour l’instant pas accessibles à la communauté astrophysique seule.