Aller au menu principal Aller au contenu principal

OPEN DATA FROM PaN FACILITIES FOR MACHINE LEARNING

du 17 octobre 14h au 18 octobre 12h30 SYNCHROTRON SOLEIL

Exploiter les données ouvertes pour l'apprentissage automatique : la communauté Photon et Neutron peut-elle le faire ?


Introduction
Au cours de la dernière décennie, la plupart des installations européennes de photons et de neutrons (PaN) ont adopté des politiques de données ouvertes, mettant les données à la disposition de l'ensemble de la communauté scientifique. Dans le même temps, l'apprentissage automatique est considéré comme un outil essentiel pour faire face à la croissance exponentielle des volumes de données provenant des installations PaN.

L'exploitation d'ensembles de données d'entraînement expérimentales est un élément clé de l'apprentissage automatique. La combinaison d'algorithmes d'apprentissage automatique et de données ouvertes peut donc être considérée comme un mariage idéal qui aiderait en fin de compte l'ensemble de la communauté à relever les défis du "big data" avec davantage d'automatisation.

Cependant, trouver les bonnes données pour entraîner les algorithmes d'apprentissage automatique est un défi et l'une des motivations pour rendre les données FAIR est exactement cela : fournir aux scientifiques travaillant sur des applications d'IA des ensembles de données d'entraînement de qualité.

Mais qu'entend-on par "qualité" dans les communautés scientifiques du PaN ? Quels sont les champs de métadonnées nécessaires pour trouver les données, pour comprendre si elles sont adaptées à nos recherches et, en fin de compte, pour pouvoir les intégrer dans nos modèles d'entraînement ? Comment pouvons-nous fournir des métadonnées suffisamment riches ? Quels seraient les éléments facilitateurs pour davantage d'applications d'apprentissage automatique ? Comment pouvons-nous améliorer la collaboration entre les producteurs de données (scientifiques du domaine) et les consommateurs de données (experts en apprentissage automatique) ?

Cliquez ici pour plus d'informations