School-StatIR-2020

27-29 mai 2020 Synchrotron SOLEIL
Date limite :

Inscriptions jusqu'au 05 mai 2020


 

Historique

La microspectroscopie infrarouge à transformer de Fourier (µFTIR) est de plus en plus souvent appliquée à l’analyse de systèmes complexes tels que cellules et tissus animaux ou végétaux qui produisent des signaux complexes et difficiles à interpréter.
De plus l’utilisation d’imageurs infrarouges matriciels permet d’obtenir rapidement de très grandes quantités de données (centaines de milliers de spectres, gigaoctets) qui dépassent les limites de capacité de traitement des microordinateurs même récents.
L’information extraite de ces jeux de données n’est plus limitée à l’intensité ou la position d’une ou quelques bandes d’absorption particulières mais est subtilement distribuée dans l’ensemble du spectre.
L’analyse des données de microspectroscopie infrarouge se révèle donc particulièrement complexe en raison de la quantité de données et de la nature des informations recherchées mais aussi de l’existence de phénomènes perturbateurs (diffusion anomale, bruit, interférences). Ces derniers rendent l’analyse encore plus complexe et imposent le recours à des méthodes de traitement du signal et stratégies d’analyse spécifiques à la µFTIR. 
Ces techniques ne sont pas enseignées dans les cursus normaux.
La ligne SMIS organise donc une formation dédiée à l’analyse des données de microspectroscopie infrarouge et particulièrement des données de biospectroscopie bien que ces techniques puissent s’appliquer à d’autres domaines et à d’autres types de spectrométrie (microspectroscopie Raman, fluorescence UV, XRF, RMN, MS…).
La ligne SMIS, en partenariat avec d’autres lignes de µFTIR synchrotron, a aussi initié le développement de QUASAR, un logiciel libre et gratuit d’analyse disposant de puissants outils d’apprentissage machine et de prétraitement du signal. Ce logiciel permet de disposer de façon simple et intuitive d’outils sophistiqués normalement réservés à quelques experts.

La formation comportera une courte introduction aux techniques d’analyse spectrale conventionnelles et se concentrera sur les méthodes de prétraitement et sur l’analyse multivariée (apprentissage machine, reconnaissance de formes) de larges jeux de données et d’imagerie hyperspectrale. Ces méthodes permettent d’utiliser les spectres infrarouges pour classifier les échantillons sur la base de leur composition chimique et signature spectrale et établir des modèles prédictifs pour le diagnostic ou la quantification.

L’édition 2020 sera la sixième organisée à SOLEIL (après 2010, 2013, 2014, 2017, 2018)  et la formation a également été organisée en 2011 à SLRI le synchrotron thaïlandais, à l’INRA en 2012 et 2018, et en 2018 et 2019 (au cours de la formation HERCULES) au synchrotron jordanien  SESAME.

Objectifs de la formation

La formation s'adresse aux scientifiques qui sont des utilisateurs passés, présents ou futurs de la ligne de lumière SMIS.
Le cours se concentrera sur l'analyse des données de microspectroscopie infrarouge pour l'analyse statistique multivariée.
Une formation pratique sera effectuée sur le logiciel Quasar (AKA Orange spectroscopy).  

  • Comprendre l'exigence d'une analyse multivariée des données des spectres infrarouges pour les applications biomédicales
     
  • Introduction aux principes et méthodes d'analyse de données multivariées
     
  • Préparer les données pour l'analyse
    - Inspection des données (graphiques, statistiques descriptives)
    - Comprendre les différents types de prétraitement
    - Prétraitements avancés (EMSC, ATR)
     
  • Méthodes de comparaison et de classification (exécution et interprétation)
    - Analyse en composantes principales (PCA)
    - Analyse de cluster hiérarchique (HCA)
    - Méthodes du plus proche voisin
     
  • Méthodes d'identification et de prédiction (exécution et interprétation)
    - Analyse discriminante partielle du moindre carré (PLS-DA)
    - Modélisation douce par analogie de classe (SIMCA)
    - Analyse discriminante (DA)
    - Classification aléatoire des forêts (RFC)
     
  • Stratégie expérimentale et d'analyse des données
    - Planification d'expériences et d'analyses
    - Sélection des données
    - Validation et interprétation des résultats


Cette formation vise à donner aux utilisateurs (principalement des biologistes) qui ne sont pas familiarisés avec l'analyse statistique multivariée et l'apprentissage automatique, des outils pour analyser leurs données de manière indépendante.

Cela augmentera le rendement de la ligne de lumière et optimisera l'implication des scientifiques de la ligne de lumière pour aider les utilisateurs à exploiter leurs données.