STAT IR8-2025

school-statir8-2024-bandeau-fr.png
18-20 juin 2025 Synchrotron SOLEIL

La ligne SMIS est ravie d’annoncer la huitième édition de sa formation aux techniques multivariées et d’apprentissage machine dédiées à l’analyse des données de microspectroscopie infrarouge : STAT-IR-8. Cette formation se déroulera du mercredi 18 au vendredi 20 juin 2025 au synchrotron SOLEIL et se tiendra en anglais.

L'objectif de cette formation est de permettre aux participants de maîtriser l’utilisation des techniques d’analyse statistique multivariées (MV) telles que l’ACP, ainsi que des techniques d’apprentissage machine (Machine Learning, ML) notamment les classifications supervisées et non-supervisées, pour l’analyse de données de microspectroscopie infrarouge. La formation inclura des exemples d’application de ces techniques à l’analyse d’images et de cartes hyperspectrales. Les participants apprendront également les techniques de prétraitement spectral nécessaires à ces analyses. Bien que la formation se concentre sur des jeux de données issus du domaine biomédical, les méthodologies enseignées sont également applicables aux données de patrimoine culturel et de sciences des polymères, ainsi qu'à celles issues des microspectroscopies Raman et de micro-fluorescence  X.

La microspectroscopie et l’imagerie infrarouges fournissent des informations cruciales sur la composition chimique, l’organisation et la conformation moléculaire des matériaux complexes avec des résolutions spatiales allant du micron au submicron. Toutefois, l’analyse de ces données nécessite des outils sophistiqués pour exploiter pleinement la richesse des spectres, notamment lorsque les ensembles de données contiennent des dizaines ou des centaines de milliers de spectres. L’utilisation de techniques automatisées est donc indispensable pour extraire des informations pertinentes.

Une approche fructueuse consiste à utiliser l’analyse statistique multivariée et l’apprentissage machine pour explorer la variabilité spectrale, identifier des corrélations entre les données, classifier les échantillons de manière objective, entraîner des algorithmes d’identification, intégrer des données provenant de différentes techniques et établir des modèles prédictifs pour la quantification.

Le succès de ces méthodes repose sur l’application de prétraitements spécifiques visant à éliminer les artefacts et les variations confuses. La formation permettra aux participants d’acquérir les compétences nécessaires à l’utilisation des logiciels, des techniques de prétraitement et des stratégies d’analyse.

La ligne SMIS est la ligne de microspectroscopie infrarouge du synchrotron SOLEIL. Dispose d’une expérience de plus de 15 ans dans la mesure et l’analyse de données de microspectroscopie infrarouge. Pour cette formation elle s’est associée au Biolab de l’Université de Ljubljana qui développe le logiciel libre d’analyse des données Quasar basé sur Orange spectroscopy. 

La formation sera dispensée par :

Ferenc Borondics, expert en physico-chimie,
Marko Toplak, spécialiste en apprentissage machine et développeur de Quasar
Christophe Sandt, expert en biospectroscopie.  

La formation sera basée sur le logiciel open-source Quasar, et inclura des séances pratiques où les participants pourront travailler sur leurs propres jeux de données.

Les cours seront données en anglais et aborderont les principales techniques d’analyse statistique multivariée et d’apprentissage machine telles que l’analyse en composante principale, des méthodes de classification (k-means, KNN, RFC…), de régression (Logit, PLS)...

La formation aura lieu sur le site du synchrotron SOLEIL et est ouverte à tous les utilisateurs actuels et futurs de la ligne SMIS.