Aller au menu principal Aller au contenu principal

NACDDB : Une base de données de dichroïsme circulaire des acides nucléiques

Une nouvelle base de données a été créée dans le cadre d'une approche scientifique concertée. Des chercheurs de Pologne, de France et des États-Unis ont uni leurs efforts pour collecter et normaliser les spectres de dichroïsme circulaire (CD) d’acides nucléiques, ADN et ARN. Plus de 150 spectres, tirés de la littérature ou récemment obtenus sur la ligne de lumière DISCO, ont été rassemblés dans la "NACDDB" et rendus accessibles au public via un serveur web https://genesilico.pl/nacddb/.

Les acides nucléiques tels que l'ADN, connu pour être le support de l’information génétique, et l'ARNm, récemment utilisé pour certains vaccins contre le COVID-19, sont des macromolécules constituées d'un squelette de phosphate et de sucres (oxy ou désoxy ribose) et de 5 molécules azotées appelées « bases » (purines et pyrimidines, notées A, C, G, T et U). Leur structure moléculaire et leur arrangement spatial, comme l'hélice à double brin pour l’ADN, est cruciale pour leur fonction.

La spectroscopie de dichroïsme circulaire mesure la différence d’absorption de la lumière circulaire polarisée droite et gauche dans le domaine de l'ultraviolet par des molécules chirales*, comme le sont les acides nucléiques par exemple. Dans ce domaine de rayonnement situé en termes d’énergie entre 5 et 7 eV, les électrons des polynucléotides sont excités par la lumière et sont à l'origine de l'absorption UV. Les bandes d'absorption caractéristiques de la lumière UV polarisée circulairement (droite ou gauche) dans les sous-domaines UV communément appelés UV A, B et C (en termes de longueurs d’onde : entre 170 et 320 nm) permettent de distinguer différents types de repliement de ces macromolécules complexes. Leur arrangement spatial corrèle avec les spectres CD, ce qui aide à déterminer le repliement des acides nucléiques étudiés.

Au cours de ces deux dernières décennies, les biologistes structuraux ont collecté, enregistré et passé au crible les spectres CD obtenus sur des protéines, ce qui leur a permis de déterminer avec succès les structures de repliement dites secondaires (hélices alpha, feuillets bêta et pelote statistique) pour des protéines amyloïdes, des protéines membranaires et des complexes protéine-protéine notamment.

La différence entre les acides nucléiques et les protéines réside dans la molécule chirale, également appelée chromophore : pour les protéines, le chromophore principal est la liaison peptidique reliant de manière covalente chacun des acides aminés constituant la protéine, liaison qui est de petite taille. Dans le cas des acides nucléiques, c’est le nucléotide constitué d’un phosphate, un sucre et une base qui forment le chromophore, plus grand et dont les combinaisons possibles sont plus variées que pour la liaison peptidique. La multitude de distances observées, par exemple chez les acides nucléiques simple ou double brin, laisse beaucoup de possibilités pour l'attribution des excitations électroniques.

En gardant cela à l'esprit et en cherchant dans la littérature, les scientifiques ont trouvé des spectres CD d'acides nucléiques publiés depuis la fin des années 50. Dans un premier temps ils ont numérisé systématiquement les spectres trouvés dans la littérature, puis ils ont ajouté des données expérimentales récemment collectées sur la ligne de lumière DISCO à SOLEIL : 63 spectres de dichroïsme circulaire de rayonnement synchrotron (SRCD) ont été collectés sur des macromolécules d'ADN et d'ARN communes ou modifiées (comme des nucléotides méthylés) en solution (figure 1), étendant ainsi le contenu d'information accessible et complémentant les spectres CD de la littérature.

Figure 1 : 63 spectres SRCD collectés sur la ligne DISCO, sur des macromolécules d'ADN et d'ARN.

Tous ces spectres (plus de 150) ont été déposés dans la base NACDDB, qui archive et met librement à disposition les données expérimentales, y compris les métadonnées expérimentales (conditions expérimentales comme le pH, la salinité et la température), les modèles 3D et les liens vers les références correspondantes. Différents types de molécules d'acide nucléique : ADN, ARN, complexes de ces deux types d’acides nucléiques, mais aussi des dérivés d'acides nucléiques modifiés présentant un intérêt pharmaceutique, ont ainsi été déposés.

La base de données permet la recherche, la comparaison, le téléchargement de spectres CD et permettra à l'avenir leur analyse pour les arrangements structuraux des acides nucléiques. Pour les séquences dont les structures 3D à haute résolution ont déjà été déterminées, ces structures sont également disponibles. La NACDDB est aussi ouverte à la soumission de spectres CD d'acides nucléiques, obtenus dans des laboratoires de biologie structurale sur des spectrophotomètres de pointe ou sur des lignes de lumière synchrotron mettant en œuvre la technique de SRCD.

Figure 2 : schéma résumant la construction de la base de données et ses futurs apports.

*Chiral (mot grec signifiant "main"), se réfère à tout ce qui ne peut être superposé à son image miroir. Les molécules chirales contiennent des centres chiraux comme les carbones tétraédriques avec quatre substituants différents – comme les atomes de carbone impliqués dans les liaisons peptidiques des protéines.