Le modèle actuellement accepté de la structure de l'ADN a été proposé en 1953 par Watson et Crick, qui ont réalisé leur modèle après avoir vu une photographie de l'ADN que Franklin avait prise par cristallographie aux rayons X.
La photo montre la forme et les dimensions de la double hélice de la molécule. Les deux brins qui composent la double hélice sont de nature complémentaire et antiparallèle. C'est-à-dire qu'un brin s'étend dans le sens 5' à 3', tandis que le brin complémentaire s'étend dans le sens 3' à 5'. (La signification de la direction sera importante lorsque nous explorerons la façon dont l'ADN se copie). L'ADN est un polymère de nucléotides qui se compose d'un sucre désoxyribose, d'un groupe phosphate et de l'une des quatre bases azotées - A, T, C et G - avec une purine toujours associée à une pyrimidine (comme Chargaff l'a constaté). Le "langage" génétique de l'ADN se trouve dans les séquences des nucléotides. Au cours de la division cellulaire, chaque cellule fille reçoit une copie de l'ADN selon un processus appelé réplication. Au cours des années qui ont suivi la découverte de la structure de l'ADN, de nombreuses technologies, dont le séquençage de l'ADN, ont été développées pour nous permettre de mieux comprendre l'ADN et son rôle dans nos génomes.
Les éléments constitutifs de l'ADN sont les nucléotides. Les composants importants du nucléotide sont une base azotée, le désoxyribose (sucre à 5 carbones) et un groupe phosphate. Le nom du nucléotide dépend de la base azotée. La base azotée peut être une purine telle que l'adénine (A) et la guanine (G), ou une pyrimidine telle que la cytosine (C) et la thymine (T).
Chaque nucléotide est composé d'un sucre, d'un groupe phosphate et d'une base azotée. Le sucre est le désoxyribose dans l'ADN et le ribose dans l'ARN.
Les nucléotides se combinent entre eux par des liaisons covalentes appelées liaisons phosphodiester ou linkages. Les purines ont une structure à double anneau avec un anneau à six membres fusionné à un anneau à cinq membres. Les pyrimidines sont plus petites ; elles ont une structure cyclique unique à six membres. Les atomes de carbone du sucre à cinq carbones sont numérotés 1', 2', 3', 4', et 5' (1' est lu comme "un premier"). Le résidu de phosphate est attaché au groupe hydroxyle du carbone 5' d'un sucre d'un nucléotide et au groupe hydroxyle du carbone 3' du sucre du nucléotide suivant, formant ainsi une liaison phosphodiester 5'-3'.
Dans les années 1950, Francis Crick et James Watson ont travaillé ensemble pour déterminer la structure de l'ADN à l'université de Cambridge, en Angleterre. D'autres scientifiques comme Linus Pauling et Maurice Wilkins exploraient aussi activement ce domaine. Pauling avait découvert la structure secondaire des protéines grâce à la cristallographie aux rayons X. Dans le laboratoire de Wilkins, la chercheuse Rosalind Franklin utilisait des méthodes de diffraction des rayons X pour comprendre la structure de l'ADN. Watson et Crick ont pu reconstituer le puzzle de la molécule d'ADN sur la base des données de Franklin, car Crick avait également étudié la diffraction des rayons X. En 1962, James Watson, Francis Crick et Maurice Wilkins ont reçu le prix Nobel de médecine. Malheureusement, Franklin était déjà mort à cette époque et les prix Nobel ne sont pas attribués à titre posthume.
Les travaux des scientifiques pionniers (a) James Watson, Francis Crick et Maclyn McCarty ont conduit à notre compréhension actuelle de l'ADN. La scientifique Rosalind Franklin a découvert (b) le schéma de diffraction des rayons X de l'ADN, ce qui a permis d'élucider sa structure en double hélice. (crédit a : modification des travaux de Marjorie McCarty, Bibliothèque publique des sciences)
Watson et Crick ont proposé que l'ADN soit constitué de deux brins qui s'enroulent l'un autour de l'autre pour former une hélice de droite. L'appariement des bases a lieu entre une purine et une pyrimidine ; à savoir, les paires A avec T et G avec C. L'adénine et la thymine sont des paires de bases complémentaires, et la cytosine et la guanine sont également des paires de bases complémentaires. Les paires de bases sont stabilisées par des liaisons hydrogène ; l'adénine et la thymine forment deux liaisons hydrogène et la cytosine et la guanine forment trois liaisons hydrogène. Les deux brins sont de nature antiparallèle, c'est-à-dire que l'extrémité 3' d'un brin fait face à l'extrémité 5' de l'autre brin. Le sucre et le phosphate des nucléotides forment l'épine dorsale de la structure, tandis que les bases azotées sont empilées à l'intérieur. Chaque paire de bases est séparée de l'autre paire de bases par une distance de 0,34 nm, et chaque tour de l'hélice mesure 3,4 nm. Par conséquent, dix paires de bases sont présentes par tour d'hélice. Le diamètre de la double hélice de l'ADN est de 2 nm, et il est uniforme sur toute sa longueur. Seul l'appariement entre une purine et une pyrimidine peut expliquer ce diamètre uniforme. La torsion des deux brins l'un autour de l'autre entraîne la formation de rainures majeures et mineures uniformément espacées.
L'ADN a (a) une structure en double hélice et (b) des liaisons phosphodiester. Les (c) sillons majeurs et mineurs sont des sites de liaison pour les protéines de liaison de l'ADN au cours de processus tels que la transcription (la copie de l'ARN à partir de l'ADN) et la réplication.
Techniques de séquençage de l'ADN
Jusqu'aux années 1990, le séquençage de l'ADN (lecture de la séquence de l'ADN) était un processus relativement coûteux et long. L'utilisation de nucléotides radiomarqués a également aggravé le problème pour des raisons de sécurité. Avec la technologie actuelle et les machines automatisées, le processus est peu coûteux, plus sûr et peut être achevé en quelques heures. Fred Sanger a développé la méthode de séquençage utilisée pour le projet de séquençage du génome humain, qui est largement utilisée aujourd'hui.
Cette méthode est connue sous le nom de méthode de terminaison de la chaîne didésoxy. La méthode de séquençage est basée sur l'utilisation de terminateurs de chaîne, les didésoxynucléotides (ddNTP). Les didésoxynucléotides, ou ddNTPS, diffèrent des désoxynucléotides par l'absence d'un groupe OH 3' libre sur le sucre à cinq atomes de carbone. Si un ddNTP est ajouté à un brin d'ADN en croissance, la chaîne n'est pas étendue davantage car le groupe OH 3' libre nécessaire pour ajouter un autre nucléotide n'est pas disponible. En utilisant un rapport prédéterminé entre les désoxyribonucléotides et les didésoxynucléotides, il est possible de générer des fragments d'ADN de différentes tailles.
Dans la méthode de terminaison de la chaîne didésoxy de Frederick Sanger, des didésoxynucléotides marqués par un colorant sont utilisés pour générer des fragments d'ADN qui se terminent à différents points. L'ADN est séparé par électrophorèse capillaire sur la base de la taille, et à partir de l'ordre des fragments formés, on peut lire la séquence d'ADN. La lecture de la séquence d'ADN est indiquée sur un électrophérogramme qui est généré par un scanner laser.
L'échantillon d'ADN à séquencer est dénaturé ou séparé en deux brins en le chauffant à haute température. L'ADN est divisé en quatre tubes dans lesquels une amorce, l'ADN polymérase et les quatre nucléotides (A, T, G et C) sont ajoutés. En plus de chacun des quatre tubes, des quantités limitées d'un des quatre didésoxynucléotides sont ajoutées à chaque tube respectivement. Les tubes sont étiquetés comme A, T, G et C selon le ddNTP ajouté. Aux fins de la détection, chacun des quatre didésoxynucléotides porte un marquage fluorescent différent. L'allongement de la chaîne se poursuit jusqu'à ce qu'un didésoxy nucléotide fluorescent soit incorporé, après quoi il n'y a plus d'allongement. Une fois la réaction terminée, une électrophorèse est effectuée. Même une différence de longueur d'une seule base peut être détectée. La séquence est lue à l'aide d'un scanner laser. Pour ses travaux sur le séquençage de l'ADN, Sanger a reçu un prix Nobel de chimie en 1980.
L'électrophorèse sur gel est une technique utilisée pour séparer des fragments d'ADN de tailles différentes. Habituellement, le gel est constitué d'un produit chimique appelé agarose. La poudre d'agarose est ajoutée à un tampon et chauffée. Après refroidissement, la solution de gel est versée dans un plateau de coulée. Une fois que le gel s'est solidifié, l'ADN est chargé sur le gel et un courant électrique est appliqué. L'ADN a une charge négative nette et se déplace de l'électrode négative vers l'électrode positive. Le courant électrique est appliqué pendant un temps suffisant pour permettre à l'ADN de se séparer en fonction de sa taille ; les plus petits fragments seront les plus éloignés du puits (où l'ADN a été chargé), et les fragments de poids moléculaire plus lourds seront les plus proches du puits. Une fois l'ADN séparé, le gel est coloré avec un colorant spécifique à l'ADN pour pouvoir le visualiser.
Génome de Néandertal : quels sont nos liens ?
Le premier projet de séquence du génome de Neandertal a été récemment publié par Richard E. Green et al. en 2010. Les Néandertaliens sont les ancêtres les plus proches des humains actuels. On sait qu'ils ont vécu en Europe et en Asie occidentale avant de disparaître des archives fossiles il y a environ 30 000 ans. L'équipe de Green a étudié des restes fossiles de près de 40 000 ans qui ont été sélectionnés dans des sites à travers le monde. Des moyens extrêmement sophistiqués de préparation des échantillons et de séquençage de l'ADN ont été utilisés en raison de la fragilité des os et de la forte contamination microbienne. Dans leur étude, les scientifiques ont pu séquencer quelque quatre milliards de paires de bases. La séquence de Néandertal a été comparée à celle des humains actuels du monde entier. Après avoir comparé les séquences, les chercheurs ont constaté que le génome de Néandertal présentait une similitude de 2 à 3 % plus grande avec les personnes vivant en dehors de l'Afrique qu'avec celles vivant en Afrique. Alors que les théories actuelles suggèrent que tous les humains actuels peuvent être rattachés à une petite population ancestrale en Afrique, les données du génome de Neandertal peuvent contredire ce point de vue. Green et ses collègues ont également découvert des segments d'ADN chez des personnes en Europe et en Asie qui ressemblent davantage aux séquences de Neandertal qu'à d'autres séquences humaines contemporaines. Autre observation intéressante : les Néandertaliens sont aussi étroitement liés aux habitants de Papouasie-Nouvelle-Guinée qu'à ceux de Chine ou de France. Cela est surprenant car les restes fossiles de Néandertal n'ont été localisés qu'en Europe et en Asie occidentale. Il est fort probable que des échanges génétiques aient eu lieu entre les Néandertaliens et les humains modernes, à l'époque où ces derniers ont émergé d'Afrique, avant la divergence des Européens, des Asiatiques de l'Est et des Papouasiens de Nouvelle-Guinée.
Plusieurs gènes semblent avoir été modifiés par les Néandertaliens au cours de l'évolution de l'homme d'aujourd'hui. Ces gènes sont impliqués dans la structure crânienne, le métabolisme, la morphologie de la peau et le développement cognitif. L'un des gènes qui présente un intérêt particulier est RUNX2, qui est différent chez l'homme moderne et chez les Néandertaliens. Ce gène est responsable de l'os frontal proéminent, de la cage thoracique en forme de cloche et des différences dentaires observées chez les Néandertaliens. On suppose qu'un changement évolutif de RUNX2 a été important à l'origine des humains modernes, et que cela a affecté le crâne et la partie supérieure du corps.
Compactage de l'ADN dans les cellules
Si l'on compare les cellules procaryotes aux cellules eucaryotes, les procaryotes sont beaucoup plus simples que les eucaryotes dans nombre de leurs caractéristiques. La plupart des procaryotes contiennent un seul chromosome circulaire qui se trouve dans une zone du cytoplasme appelée le nucléoïde.
Un eucaryote contient un noyau bien défini, alors que chez les procaryotes, le chromosome se trouve dans le cytoplasme, dans une zone appelée nucléoïde.
La taille du génome de l'un des procaryotes les plus étudiés, E.coli, est de 4,6 millions de paires de bases (environ 1,1 mm, si on le coupe et l'étire). Comment cela s'inscrit-il donc dans une petite cellule bactérienne ? L'ADN est tordu par ce que l'on appelle la supercoillation. La supercoillation signifie que l'ADN est soit sous-enroulé (moins d'un tour d'hélice pour 10 paires de bases), soit sur-enroulé (plus d'un tour pour 10 paires de bases) par rapport à son état normal de relaxation. Certaines protéines sont connues pour être impliquées dans la supercoillation ; d'autres protéines et enzymes telles que l'ADN gyrase aident à maintenir la structure supercoilée.
Les eucaryotes, dont les chromosomes sont constitués chacun d'une molécule d'ADN linéaire, emploient un type différent de stratégie d'empaquetage pour faire entrer leur ADN dans le noyau. Au niveau le plus élémentaire, l'ADN est enroulé autour de protéines appelées histones pour former des structures appelées nucléosomes. Les histones sont des protéines conservées au cours de l'évolution, riches en acides aminés basiques, qui forment un octamère. L'ADN (qui est chargé négativement en raison des groupes phosphate) est étroitement enroulé autour du noyau des histones. Ce nucléosome est relié au suivant à l'aide d'un ADN de liaison. Cette structure est également connue sous le nom de "perles sur une corde". Celle-ci est ensuite compactée en une fibre de 30 nm, qui correspond au diamètre de la structure. Au stade de la métaphase, les chromosomes sont les plus compacts, mesurent environ 700 nm de large et se trouvent en association avec les protéines de l'échafaudage.
En interphase, les chromosomes eucaryotes présentent deux régions distinctes que l'on peut distinguer par coloration. La région étroitement emballée est appelée hétérochromatine, et la région moins dense est appelée euchromatine. L'hétérochromatine contient généralement des gènes qui ne sont pas exprimés et se trouve dans les régions du centromère et des télomères. L'euchromatine contient généralement des gènes qui sont transcrits, l'ADN étant emballé autour des nucléosomes mais pas plus compacté.
Ces figures illustrent le compactage du chromosome eucaryote.
Source: DNA Structure and Sequencing