Aller au menu principal Aller au contenu principal

STAT IR8-2025

18-20 juin 2025 Synchrotron SOLEIL

La ligne SMIS est ravie d’annoncer la huitième édition de sa formation aux techniques multivariées et d’apprentissage machine dédiées à l’analyse des données de microspectroscopie infrarouge : STAT-IR-8. Cette formation se déroulera du mercredi 18 au vendredi 20 juin 2025 au synchrotron SOLEIL et se tiendra en anglais.

L'objectif de cette formation est de permettre aux participants de maîtriser l’utilisation des techniques d’analyse statistique multivariées (MV) telles que l’ACP, ainsi que des techniques d’apprentissage machine (Machine Learning, ML) notamment les classifications supervisées et non-supervisées, pour l’analyse de données de microspectroscopie infrarouge. La formation inclura des exemples d’application de ces techniques à l’analyse d’images et de cartes hyperspectrales. Les participants apprendront également les techniques de prétraitement spectral nécessaires à ces analyses. Bien que la formation se concentre sur des jeux de données issus du domaine biomédical, les méthodologies enseignées sont également applicables aux données de patrimoine culturel et de sciences des polymères, ainsi qu'à celles issues des microspectroscopies Raman et de micro-fluorescence  X.

La microspectroscopie et l’imagerie infrarouges fournissent des informations cruciales sur la composition chimique, l’organisation et la conformation moléculaire des matériaux complexes avec des résolutions spatiales allant du micron au submicron. Toutefois, l’analyse de ces données nécessite des outils sophistiqués pour exploiter pleinement la richesse des spectres, notamment lorsque les ensembles de données contiennent des dizaines ou des centaines de milliers de spectres. L’utilisation de techniques automatisées est donc indispensable pour extraire des informations pertinentes.

Une approche fructueuse consiste à utiliser l’analyse statistique multivariée et l’apprentissage machine pour explorer la variabilité spectrale, identifier des corrélations entre les données, classifier les échantillons de manière objective, entraîner des algorithmes d’identification, intégrer des données provenant de différentes techniques et établir des modèles prédictifs pour la quantification.

Le succès de ces méthodes repose sur l’application de prétraitements spécifiques visant à éliminer les artefacts et les variations confuses. La formation permettra aux participants d’acquérir les compétences nécessaires à l’utilisation des logiciels, des techniques de prétraitement et des stratégies d’analyse.

La ligne SMIS est la ligne de microspectroscopie infrarouge du synchrotron SOLEIL. Dispose d’une expérience de plus de 15 ans dans la mesure et l’analyse de données de microspectroscopie infrarouge. Pour cette formation elle s’est associée au Biolab de l’Université de Ljubljana qui développe le logiciel libre d’analyse des données Quasar basé sur Orange spectroscopy. 

La formation sera dispensée par :

Ferenc Borondics, expert en physico-chimie,
Marko Toplak, spécialiste en apprentissage machine et développeur de Quasar
Christophe Sandt, expert en biospectroscopie.  

La formation sera basée sur le logiciel open-source Quasar, et inclura des séances pratiques où les participants pourront travailler sur leurs propres jeux de données.

Les cours seront données en anglais et aborderont les principales techniques d’analyse statistique multivariée et d’apprentissage machine telles que l’analyse en composante principale, des méthodes de classification (k-means, KNN, RFC…), de régression (Logit, PLS)...

La formation aura lieu sur le site du synchrotron SOLEIL et est ouverte à tous les utilisateurs actuels et futurs de la ligne SMIS.

PRELIMINARY PROGRAMM

    Wednesday, June 18

Thursday, June 19

Supervised learning

Friday, June 20

Unsupervised learning
Session 1 9:00

Getting started with Quasar (installation, basic Orange and Quasar functionality)

Speaker: C Sandt, M Toplak

Introduction to supervised and unsupervised learning
 

Speaker: C Sandt

Quantification

Speaker: C Sandt

Break 10:30      
Session 2 10:45

Spectral Preprocessing

Visualization – mapping and imaging, univariate analysis

Speaker: C. Sandt

Supervised analysis.

Classification of spectra and hyperspectral datasets using various methods

Speaker: F Borondics

Unsupervised analysis. Clustering of spectra and hyperspectral datasets using various methods

Speaker: M Toplak

Lunch break 12:00-13:30      
Session 3 13:30

Statistical data exploration

PCA, PCA visualization

PCA imaging

Speaker: C Sandt

Model inspection and cross-validation
Prediction
Common errors

Speaker: M Toplak

Image Analysis

 

Speaker: ??

Break 15:30      
Session 4 16:00

Hands-on work with participants' data

Hands-on work with participants' data

 
  17:30      

 

SCIENTIFIC COMMITTEE:

Ferenc Borondics, expert in physical chemistry,

Marko Toplak, machine learning specialist and one of the developers of Quasar software,

Christophe Sandt, biospectroscopy expert.

 

LOCAL ORGANIZING COMMITTEE:

Sylvie Bonnardel

Eliott Cogne

Mary-Anna Destermes

Frédérique Fraissard

Christophe Sandt

Venue information

If you come by car:

Geographic Address:
Synchrotron SOLEIL

l'Orme des Merisiers
Départementale 128
91190 Saint Aubin

GPS coordinates:
Latitude: 48.711922
Longitude: 2.146156
at the intersection of RD306 and D128

If you come by public transport:

From PARIS and CHARLES-DE-GAULLE airport
RER B direction SAINT-RÉMY-LÈS-CHEVREUSE until:


the station "MASSY-PALAISEAU" then BUS no. 91-06 B or C direction SAINT-QUENTIN GARE, stop "L'ORME DES MERISIERS".
Timetable bus 91-06

the station "LE GUICHET" then join the bus station, take bus no. 9, direction SACLAY, stop "L'ORME DES MERISIERS".
Timetable bus 9

station "GIF SUR YVETTE", take bus no. 10, stop SAINT AUBIN
Timetable bus 10

From Orly Airport, take the ORLYVAL, get off at ANTONY, take the RER B (see above) or take the BUS n°91-10 direction "Christ / N
Timetable RER B

For further information please contact: Conf-statir8-2025@synchrotron-soleil.fr