Le processus cellulaire de transcription génère l'ARN messager (ARNm), une copie moléculaire mobile d'un ou plusieurs gènes avec un alphabet de A, C, G et uracile (U).

La traduction de la matrice d'ARNm convertit l'information génétique basée sur les nucléotides en un produit protéique. Les séquences protéiques sont constituées de 20 acides aminés courants ; on peut donc dire que l'alphabet des protéines est constitué de 20 lettres. Chaque acide aminé est défini par une séquence de trois nucléotides appelée codon triplet. Les différents acides aminés ont des chimies différentes (par exemple, acide ou basique, polaire ou non polaire) et des contraintes structurelles différentes. La variation de la séquence des acides aminés entraîne une énorme variation de la structure et de la fonction des protéines.

Les structures des 20 acides aminés présents dans les protéines sont montrées. Chaque acide aminé est composé d'un groupe amino ( NH+3 ), d'un groupe carboxyle (COO-) et d'une chaîne latérale (en bleu). La chaîne latérale peut être non polaire, polaire ou chargée, ainsi que grande ou petite. C'est la variété des chaînes latérales d'acides aminés qui donne lieu à l'incroyable variation de la structure et de la fonction des protéines.

Le Dogme Central : L'ADN code l'ARN ; l'ARN code la protéine

Le flux d'informations génétiques dans les cellules, de l'ADN à l'ARNm et aux protéines, est décrit par le Dogme central, qui stipule que les gènes spécifient la séquence des ARNm, qui à leur tour spécifient la séquence des protéines. Le décodage d'une molécule à une autre est effectué par des protéines et des ARN spécifiques. L'information stockée dans l'ADN étant si essentielle au fonctionnement cellulaire, il est intuitif que la cellule fasse des copies d'ARNm de cette information pour la synthèse des protéines, tout en gardant l'ADN lui-même intact et protégé. La copie de l'ADN en ARN est relativement simple, un nucléotide étant ajouté au brin d'ARNm pour chaque nucléotide lu dans le brin d'ADN. La traduction en protéine est un peu plus complexe car trois nucléotides d'ARNm correspondent à un acide aminé dans la séquence polypeptidique. Cependant, la traduction en protéine est encore systématique et colinéaire, de sorte que les nucléotides 1 à 3 correspondent à l'acide aminé 1, les nucléotides 4 à 6 correspondent à l'acide aminé 2, et ainsi de suite.

Les instructions relatives à l'ADN sont transcrites sur l'ARN messager. Les ribosomes sont capables de lire l'information génétique inscrite sur un brin d'ARN messager et d'utiliser cette information pour enchaîner les acides aminés en une protéine.

Le code génétique est dégénéré et universel

Étant donné les différents nombres de "lettres" dans l'ARNm et les "alphabets" des protéines, les scientifiques ont émis l'hypothèse que les combinaisons de nucléotides correspondaient à des acides aminés uniques. Les doublets de nucléotides ne seraient pas suffisants pour spécifier chaque acide aminé car il n'y a que 16 combinaisons possibles de deux nucléotides (42). En revanche, il y a 64 triplets de nucléotides possibles (43), ce qui est bien plus que le nombre d'acides aminés. Les scientifiques ont émis l'hypothèse que les acides aminés étaient codés par des triplets de nucléotides et que le code génétique était dégénéré. En d'autres termes, un acide aminé donné pouvait être codé par plus d'un triplet de nucléotides. Cela a été confirmé expérimentalement par la suite ; Francis Crick et Sydney Brenner ont utilisé le mutagène chimique proflavine pour insérer un, deux ou trois nucléotides dans le gène d'un virus. Lorsqu'un ou deux nucléotides étaient insérés, la synthèse des protéines était complètement abolie. Lorsque trois nucléotides étaient insérés, la protéine était synthétisée et fonctionnelle. Cela a démontré que trois nucléotides spécifient chaque acide aminé. Ces triplets de nucléotides sont appelés codons. L'insertion d'un ou deux nucléotides a complètement changé le cadre de lecture des triplets, modifiant ainsi le message pour chaque acide aminé suivant. Bien que l'insertion de trois nucléotides ait provoqué l'insertion d'un acide aminé supplémentaire pendant la traduction, l'intégrité du reste de la protéine a été maintenue.

La délétion de deux nucléotides déplace le cadre de lecture d'un ARNm et modifie l'ensemble du message protéique, créant une protéine non fonctionnelle ou interrompant complètement la synthèse des protéines.

Les scientifiques ont minutieusement résolu le code génétique en traduisant in vitro les ARNm synthétiques et en séquençant les protéines qu'ils ont spécifiées.

Cette figure montre le code génétique permettant de traduire chaque triplet de nucléotides de l'ARNm en un acide aminé ou un signal de terminaison dans une protéine naissante. (crédit : modification des travaux par le NIH)

En plus d'ordonner l'ajout d'un acide aminé spécifique à une chaîne polypeptidique, trois des 64 codons mettent fin à la synthèse de la protéine et libèrent le polypeptide du mécanisme de traduction. Ces triplets sont appelés codons absurdes, ou codons stop. Un autre codon, AUG, a également une fonction particulière. En plus de spécifier l'acide aminé méthionine, il sert également de codon de départ pour initier la traduction. Le cadre de lecture pour la traduction est fixé par le codon de départ AUG près de l'extrémité 5' de l'ARNm.

Le code génétique est universel. À quelques exceptions près, pratiquement toutes les espèces utilisent le même code génétique pour la synthèse des protéines. La conservation des codons signifie qu'un ARNm purifié codant pour la protéine globine du cheval pourrait être transféré à une cellule tulipe, et la tulipe synthétiserait la globine du cheval. Le fait qu'il n'y ait qu'un seul code génétique est une preuve puissante que toute la vie sur Terre partage une origine commune, surtout si l'on considère qu'il y a environ 1084 combinaisons possibles de 20 acides aminés et 64 codons triples.

On pense que la dégénérescence est un mécanisme cellulaire permettant de réduire l'impact négatif des mutations aléatoires. Les codons qui spécifient le même acide aminé ne diffèrent généralement que par un seul nucléotide. En outre, les acides aminés dont les chaînes latérales sont chimiquement similaires sont codés par des codons similaires. Cette nuance du code génétique garantit qu'une mutation de substitution d'un seul nucléotide peut soit spécifier le même acide aminé mais n'avoir aucun effet, soit spécifier un acide aminé similaire, ce qui empêche de rendre la protéine complètement non fonctionnelle.

D'après The Genetic Code

Ce site internet met des documents à votre disposition seulement et uniquement à titre d'information. Ils ne peuvent en aucun cas remplacer la consultation d'un médecin ou les soins prodigués par un praticien qualifié et ne doivent par conséquent jamais être interprétés comme pouvant le faire.

Connexion