Aller au menu principal Aller au contenu principal

School-StatIR-2020

27-29 mai 2020 Synchrotron SOLEIL
Date limite :

Inscriptions jusqu'au 05 mai 2020


 

Historique

La microspectroscopie infrarouge à transformer de Fourier (µFTIR) est de plus en plus souvent appliquée à l’analyse de systèmes complexes tels que cellules et tissus animaux ou végétaux qui produisent des signaux complexes et difficiles à interpréter.
De plus l’utilisation d’imageurs infrarouges matriciels permet d’obtenir rapidement de très grandes quantités de données (centaines de milliers de spectres, gigaoctets) qui dépassent les limites de capacité de traitement des microordinateurs même récents.
L’information extraite de ces jeux de données n’est plus limitée à l’intensité ou la position d’une ou quelques bandes d’absorption particulières mais est subtilement distribuée dans l’ensemble du spectre.
L’analyse des données de microspectroscopie infrarouge se révèle donc particulièrement complexe en raison de la quantité de données et de la nature des informations recherchées mais aussi de l’existence de phénomènes perturbateurs (diffusion anomale, bruit, interférences). Ces derniers rendent l’analyse encore plus complexe et imposent le recours à des méthodes de traitement du signal et stratégies d’analyse spécifiques à la µFTIR. 
Ces techniques ne sont pas enseignées dans les cursus normaux.
La ligne SMIS organise donc une formation dédiée à l’analyse des données de microspectroscopie infrarouge et particulièrement des données de biospectroscopie bien que ces techniques puissent s’appliquer à d’autres domaines et à d’autres types de spectrométrie (microspectroscopie Raman, fluorescence UV, XRF, RMN, MS…).
La ligne SMIS, en partenariat avec d’autres lignes de µFTIR synchrotron, a aussi initié le développement de QUASAR, un logiciel libre et gratuit d’analyse disposant de puissants outils d’apprentissage machine et de prétraitement du signal. Ce logiciel permet de disposer de façon simple et intuitive d’outils sophistiqués normalement réservés à quelques experts.

La formation comportera une courte introduction aux techniques d’analyse spectrale conventionnelles et se concentrera sur les méthodes de prétraitement et sur l’analyse multivariée (apprentissage machine, reconnaissance de formes) de larges jeux de données et d’imagerie hyperspectrale. Ces méthodes permettent d’utiliser les spectres infrarouges pour classifier les échantillons sur la base de leur composition chimique et signature spectrale et établir des modèles prédictifs pour le diagnostic ou la quantification.

L’édition 2020 sera la sixième organisée à SOLEIL (après 2010, 2013, 2014, 2017, 2018)  et la formation a également été organisée en 2011 à SLRI le synchrotron thaïlandais, à l’INRA en 2012 et 2018, et en 2018 et 2019 (au cours de la formation HERCULES) au synchrotron jordanien  SESAME.

Objectifs de la formation

La formation s'adresse aux scientifiques qui sont des utilisateurs passés, présents ou futurs de la ligne de lumière SMIS.
Le cours se concentrera sur l'analyse des données de microspectroscopie infrarouge pour l'analyse statistique multivariée.
Une formation pratique sera effectuée sur le logiciel Quasar (AKA Orange spectroscopy).  

  • Comprendre l'exigence d'une analyse multivariée des données des spectres infrarouges pour les applications biomédicales
     
  • Introduction aux principes et méthodes d'analyse de données multivariées
     
  • Préparer les données pour l'analyse
    - Inspection des données (graphiques, statistiques descriptives)
    - Comprendre les différents types de prétraitement
    - Prétraitements avancés (EMSC, ATR)
     
  • Méthodes de comparaison et de classification (exécution et interprétation)
    - Analyse en composantes principales (PCA)
    - Analyse de cluster hiérarchique (HCA)
    - Méthodes du plus proche voisin
     
  • Méthodes d'identification et de prédiction (exécution et interprétation)
    - Analyse discriminante partielle du moindre carré (PLS-DA)
    - Modélisation douce par analogie de classe (SIMCA)
    - Analyse discriminante (DA)
    - Classification aléatoire des forêts (RFC)
     
  • Stratégie expérimentale et d'analyse des données
    - Planification d'expériences et d'analyses
    - Sélection des données
    - Validation et interprétation des résultats


Cette formation vise à donner aux utilisateurs (principalement des biologistes) qui ne sont pas familiarisés avec l'analyse statistique multivariée et l'apprentissage automatique, des outils pour analyser leurs données de manière indépendante.

Cela augmentera le rendement de la ligne de lumière et optimisera l'implication des scientifiques de la ligne de lumière pour aider les utilisateurs à exploiter leurs données.

Preliminary program
   

Wednesday May 27, 2020
Mercredi 27 mai 2020

Thursday May 28, 2020
Jeudi 28 mai 2020

Friday May 29, 2020
Vendredi 29 mai 2020

Session 1

08:30 - 10:30 Introduction to multivariate statistical
analysis for IR: the need for MVA
Principal Component Analysis: theory

Imaging:
Theory

  10:30 - 10:45 Coffe break   /   Pause Coffe break   /   Pause Coffe break   /   Pause

Session 2

10:45 - 12:15 Introduction to multivariate statistical
analysis: basic methods
Principal Component Analysis: practical

Imaging:
Practical with Orange

  12:15 - 13:30 Lunch   /   Déjeuner  Lunch   /   Déjeuner  Lunch   /   Déjeuner 

Session 3

13:30 - 15:30 Preparing data: basic preprocessing methods,
advanced preprocessing methods

Regression methods:

  • MCR-ALS
  • PCR
  • PLSR and PLSDA
  • LR
Hand on practical user data 1
  15:30 - 15:45 Coffe break   /   Pause Coffe break   /   Pause Coffe break   /   Pause

Session 4

15:45 - 17:15

Basic clustering methods

  • KNN
  • K-means, K-median
  • HCA
  • LDA
  • CART

Advanced clustering methods

  • RFC
  • ANN
  • SIMCA
Hand on practical user data 1

Une place importante sera donnée à l’analyse des données d’imagerie spectrale à l’aide du logiciel libre Quasar (anciennement Orange spectroscopy https://www.synchrotron-soleil.fr/en/news/new-tools-data-analysis-orange-infrared-and-spectral-orange ) résultant d’une collaboration entre la ligne SMIS et de l’Université de Ljubljana. 

Organizing Committee:

Teachers, SMIS beamline: 

Ferenc BORONDICS
Christophe SANDT
Marko TOPLAK
 

Local organizing:

Sylvie BONNARDEL
Frédérique FRAISSARD

  •  Ouverture des inscriptions à partir du Mardi 31 mars 2020
  •  Date limite des inscriptions fixée au Mardi 5 mai 2020

 

  • Le nombre de places est limité à 20 personnes.
  • Les inscriptions s'effectueront sur sélection de dossier de candidature.
  • Les cours seront dispensés en anglais.

 

  • Les frais d'inscriptions s'élèvent à 100 € et incluent les pauses cafés, 3 repas et 2 dîners.
  • Les frais de voyage et d'hébergement seront à la charge des participants.

 

Accommodation

SOLEIL Guest House
L'Orme des Merisiers - 91190 GIF / YVETTE
Tel: +33(0)1 69 35 82 00
Email: hebergement@synchrotron-soleil.fr 

  • Référence:    STAT IR6
  • Night:           30 €
  • Breakfast:      5 €

Access to SOLEIL

If you come by car:

Geographical address: 
Synchrotron SOLEIL
L’Orme des Merisiers 
Rond point du Golf de Saint Aubin
91190 Saint Aubin

Location coordinates:
Latitude : 48.711922
Longitude : 2.146156
Intersection between RD306 and D128

 

If you come by Public Transports:

From PARIS and CHARLES-DE-GAULLE Airport: RER B direction to SAINT-RÉMY-LÈS-CHEVREUSE and stop at:

"MASSY-PALAISEAU" station - BUS n°91-06 B ou C direction to SAINT-QUENTIN GARE, stop at “L’ORME DES MERISIERS”;

"LE GUICHET" station - walk to the bus station, take bus n°9, direction to SACLAY, stop at "L’ORME DES MERISIERS";

"GIF SUR YVETTE" station, take bus n° 10, stop at "SAINT AUBIN";

From ORLY Airport : ORLYVAL train, stop at ANTONY, take the RER B (then same as above) or BUS n°91-10 direction "Christ / N306, Saclay", stop at "L'ORME DES MERISIERS" (around 1h - end of service at 9 p.m).

 

Christophe SANDT, scientifique sur la ligne de lumière SMIS

Sylvie BONNARDEL, gestionnaire évènementiels

e-mail : School-StatIR2020@synchrotron-soleil.fr