
La ligne SMIS est ravie d’annoncer la huitième édition de sa formation aux techniques multivariées et d’apprentissage machine dédiées à l’analyse des données de microspectroscopie infrarouge : STAT-IR-8. Cette formation se déroulera du mercredi 18 au vendredi 20 juin 2025 au synchrotron SOLEIL et se tiendra en anglais.
L'objectif de cette formation est de permettre aux participants de maîtriser l’utilisation des techniques d’analyse statistique multivariées (MV) telles que l’ACP, ainsi que des techniques d’apprentissage machine (Machine Learning, ML) notamment les classifications supervisées et non-supervisées, pour l’analyse de données de microspectroscopie infrarouge. La formation inclura des exemples d’application de ces techniques à l’analyse d’images et de cartes hyperspectrales. Les participants apprendront également les techniques de prétraitement spectral nécessaires à ces analyses. Bien que la formation se concentre sur des jeux de données issus du domaine biomédical, les méthodologies enseignées sont également applicables aux données de patrimoine culturel et de sciences des polymères, ainsi qu'à celles issues des microspectroscopies Raman et de micro-fluorescence X.
La microspectroscopie et l’imagerie infrarouges fournissent des informations cruciales sur la composition chimique, l’organisation et la conformation moléculaire des matériaux complexes avec des résolutions spatiales allant du micron au submicron. Toutefois, l’analyse de ces données nécessite des outils sophistiqués pour exploiter pleinement la richesse des spectres, notamment lorsque les ensembles de données contiennent des dizaines ou des centaines de milliers de spectres. L’utilisation de techniques automatisées est donc indispensable pour extraire des informations pertinentes.
Une approche fructueuse consiste à utiliser l’analyse statistique multivariée et l’apprentissage machine pour explorer la variabilité spectrale, identifier des corrélations entre les données, classifier les échantillons de manière objective, entraîner des algorithmes d’identification, intégrer des données provenant de différentes techniques et établir des modèles prédictifs pour la quantification.
Le succès de ces méthodes repose sur l’application de prétraitements spécifiques visant à éliminer les artefacts et les variations confuses. La formation permettra aux participants d’acquérir les compétences nécessaires à l’utilisation des logiciels, des techniques de prétraitement et des stratégies d’analyse.
La ligne SMIS est la ligne de microspectroscopie infrarouge du synchrotron SOLEIL. Dispose d’une expérience de plus de 15 ans dans la mesure et l’analyse de données de microspectroscopie infrarouge. Pour cette formation elle s’est associée au Biolab de l’Université de Ljubljana qui développe le logiciel libre d’analyse des données Quasar basé sur Orange spectroscopy.
La formation sera dispensée par :
Ferenc Borondics, expert en physico-chimie,
Marko Toplak, spécialiste en apprentissage machine et développeur de Quasar
Christophe Sandt, expert en biospectroscopie.
La formation sera basée sur le logiciel open-source Quasar, et inclura des séances pratiques où les participants pourront travailler sur leurs propres jeux de données.
Les cours seront données en anglais et aborderont les principales techniques d’analyse statistique multivariée et d’apprentissage machine telles que l’analyse en composante principale, des méthodes de classification (k-means, KNN, RFC…), de régression (Logit, PLS)...
La formation aura lieu sur le site du synchrotron SOLEIL et est ouverte à tous les utilisateurs actuels et futurs de la ligne SMIS.
PRELIMINARY PROGRAMM
Wednesday, June 18 |
Thursday, June 19 Supervised learning |
Friday, June 20 Unsupervised learning |
||
Session 1 | 9:00 |
Getting started with Quasar (installation, basic Orange and Quasar functionality) Speaker: C Sandt, M Toplak |
Introduction to supervised and unsupervised learning Speaker: C Sandt |
Quantification Speaker: C Sandt |
Break | 10:30 | |||
Session 2 | 10:45 |
Spectral Preprocessing Visualization – mapping and imaging, univariate analysis Speaker: C. Sandt |
Supervised analysis. Classification of spectra and hyperspectral datasets using various methods Speaker: F Borondics |
Unsupervised analysis. Clustering of spectra and hyperspectral datasets using various methods |
Lunch break | 12:00-13:30 | |||
Session 3 | 13:30 |
Statistical data exploration PCA, PCA visualization PCA imaging Speaker: C Sandt |
Model inspection and cross-validation Speaker: M Toplak |
Image Analysis
Speaker: ?? |
Break | 15:30 | |||
Session 4 | 16:00 |
Hands-on work with participants' data |
Hands-on work with participants' data |
|
17:30 |
SCIENTIFIC COMMITTEE:
Ferenc Borondics, expert in physical chemistry,
Marko Toplak, machine learning specialist and one of the developers of Quasar software,
Christophe Sandt, biospectroscopy expert.
LOCAL ORGANIZING COMMITTEE:
Sylvie Bonnardel
Eliott Cogne
Mary-Anna Destermes
Frédérique Fraissard
Christophe Sandt
Venue information
If you come by car:
Geographic Address:
Synchrotron SOLEIL
l'Orme des Merisiers
Départementale 128
91190 Saint Aubin
GPS coordinates:
Latitude: 48.711922
Longitude: 2.146156
at the intersection of RD306 and D128
If you come by public transport:
From PARIS and CHARLES-DE-GAULLE airport
RER B direction SAINT-RÉMY-LÈS-CHEVREUSE until:
the station "MASSY-PALAISEAU" then BUS no. 91-06 B or C direction SAINT-QUENTIN GARE, stop "L'ORME DES MERISIERS".
Timetable bus 91-06
the station "LE GUICHET" then join the bus station, take bus no. 9, direction SACLAY, stop "L'ORME DES MERISIERS".
Timetable bus 9
station "GIF SUR YVETTE", take bus no. 10, stop SAINT AUBIN
Timetable bus 10
From Orly Airport, take the ORLYVAL, get off at ANTONY, take the RER B (see above) or take the BUS n°91-10 direction "Christ / N
Timetable RER B
For further information please contact: Conf-statir8-2025@synchrotron-soleil.fr