7-
Le code génétique
L'ADN
est avant tout une information. L'ADN contient, inscrit dans sa
structure même, toutes les informations nécessaires
à la cellule pour synthétiser les milliers de protéines
différentes qui sont nécessaire à sa survie.
C'est, en quelque sorte, l'équivalent du disque dur de
votre ordinateur. Un disque dur sur lequel on retrouverait des
recettes de protéines.
Mais
comment une molécule peut-elle constituer une information?
Comment cette molécule peut-elle indiquer à la cellule
comment synthétiser du lysozyme ou de l'hémoglobine?
Prenons,
comme exemple, l'information nécessaire pour synthétiser
du lysozyme. On pourrait écrire cette information en représentant
chacun des 130 acides aminés de la chaîne par
trois lettres de l'alphabet latin. On obtiendrait
ceci:
Le
lysozyme
LYS
VAL PHE GLU ARG CYS GLU LEU ALA ARG THR LEU LYS ARG LEU GLY
MET ASP GLY TYR ARG GLY ILE SER LEU ALA ASN TRP MET CYS LEU
ALA LYS TRP GLU SER GLY TYR ASN THR ARG ALA THR ASN TYR ASN
ALA GLY ASP ARG SER THR ASP TYR GLY ILE PHE GLN ILE ASN SER
ARG TYR TRP CYS ASN ASP GLY LYS THR PRO GLY ALA VAL ASN ALA
CYS HIS LEU SER CYS SER ALA LEU LEU GLN ASP ASN ILE ALA ASP
ALA VAL ALA CYS ALA LYS ARG VAL VAL ARG ASP PRO GLN GLY ILE
ARG ALA TRP VAL ALA TRP ARG ASN ARG CYS GLN ASN ARG ASP VAL
ARG GLN TYR VAL GLN GLY CYS GLY VAL |
Les
trois caractères LYS, par exemple, codent pour l'acide
aminé lysine; les caractères VAL
codent pour la valine, etc.
Cependant,
ce code serait inutilisable pour la cellule. On voit difficilement
comment on pourrait entrer cette recette faite d'un alphabet latin
dans la cellule et comment on pourrait lui apprendre à
l'utiliser (à décoder la recette) pour fabriquer
du lysozyme.
Pourtant
cette recette du lysozyme est bien présente dans chacune
de vos cellules. Comme nous le verrons, elle n'est pas écrite
avec des lettres de l'alphabet, mais avec des molécules,
plus précisément des nucléotides.
Les nucléotides forment un code que la cellule peut lire
et reproduire.
|
|
Pour
comprendre ce code, utilisons une analogie.
Supposons que
vous voulez écrire un message secret en utilisant des billes
de couleur que vous enfilez sur un fil. Vous devez donc faire
correspondre des billes à des lettres de l'alphabet. Supposons
aussi que vous disposez de seulement quatre couleurs de billes:
rouge, jaune,
vert et bleu.
On
pourrait, par exemple, former un code où chaque bille correspondrait
à une lettre de l'alphabet. La jaune, par exemple, pourrait
correspondre à la lettre A, la verte à la lettre
B, la bleue à la lettre C et la rouge à la lettre
D. Vous voyez immédiatement le problème. Notre code
ne permettrait que de désigner 4 lettres sur les 26 de
l'alphabet. On pourrait écrire BABA (vert-jaune-vert-jaune)
ou BAC (vert-jaune-bleu), mais pas BIOLOGIE.
Regroupons
les billes deux par deux. Par exemple: bleu-rouge
correspondrait à "A", jaune-vert à "B",
bleu-bleu à "C" et ainsi de suite.
"BABA" s’écrirait alors:
C'est
déjà mieux, on a maintenant 16 combinaisons
possibles ( 42 ). Malheureusement,
ce n'est pas assez puisque l'alphabet comporte 26 lettres.
Regroupons
alors les billes par trois. Par exemple, décidons
que les trois billes jaune-bleu-rouge représentent
la lettre A, bleu-jaune-vert
la lettre B, jaune-rouge-rouge la
lettre C et ainsi de suite jusqu'à Z.
Avec des combinaisons de trois billes, on peut former 64
combinaisons différentes ( 43 ),
c’est plus que ce qui est nécessaire pour coder 26
lettres. On pourrait ainsi rédiger un message en enfilant
des billes de couleur sur un fil.
«
BABA » s’écrirait en enfilant dans l’ordre,
les billes:
|
|
Quiconque
connaît le code utilisé pourrait lire le message
en regardant la succession des billes de couleur formant le chapelet.
La séquence des billes constitue un message codé.
Sauriez-vous, avec ce code, écrire « BAC »?
Plutôt
qu’utiliser des billes, utilisons quelque chose de beaucoup,
beaucoup plus petit, des nucléotides.
Il y a quatre sortes de nucléotides, A,
T, C et G.
Lions ces nucléotides les uns aux autres comme les billes
de couleur de l'exemple précédent. On pourrait imaginer
un code où chaque groupe de trois nucléotides correspondrait
non pas à une lettre de l’alphabet (la cellule n’a
que faire de l’alphabet romain) mais à
un des 20 acides aminés formant les protéines.
On pourrait ainsi former des messages correspondant à
la recette d’une protéine.
Convenons,
par exemple, que les trois nucléotides A-A-A
représentent l’acide aminé phénylalanine,
G-A-C représentent
la leucine, T-C-T
l’arginine et ainsi de suite.
|
A-A-A
= PHE
G-A-C = LEU
T-C-T = ARG |
La protéine formée des cinq acides aminés
Phé-Arg-Leu-Phé-Leu
pourrait être représentée
(codée) par la chaîne formée des nucléotides:
On
aurait ainsi une molécule (un polymère de
nucléotides) qui représenterait, sous forme
codée, la recette d’une protéine. On pourrait
aussi mettre « bout à bout », des milliers
de recettes différentes. Eh bien, l'ADN d'un chromosome,
c’est exactement ça!
Imaginez
chaque chromosome comme une longue, une très longue succession
de nucléotides, un chapelet pouvant avoir une centaine
de millions de perles. Chaque groupe successif de trois nucléotides
désigne un acide aminé selon un code préétabli
connu par les cellules et chaque recette de protéine constitue
un gène.
C'est
au début des années 60 qu'on a réussi à
trouver le code (nous verrons plus loin comment) :
Le
code génétique |
Dans
l'exemple des billes, c'est moi qui ai arbitrairement
décidé du code. J'ai fait correspondre,
par exemple, les billes jaune-bleu-rouge à la lettre
A. J'aurais pu utiliser une autre combinaison.
Mais
dans le cas du code génétique, "qui"
ou "quoi" a décidé du code ?
Pourquoi est-ce AAA qui code pour la phénylalanine
et non une autre combinaison de nucléotides? Actuellement
on ne le sait pas. On imagine que le code s’est
formé au tout début de l’histoire
de la vie, il y a plus de trois milliards d’années.
Mais on ne peut absolument pas expliquer pourquoi c’est
ce code (celui que vous pouvez voir en cliquant sur le
lien à gauche) qui a été retenu par
la nature.
Peut-être
que plusieurs codes différents se sont même
formés au tout début de la vie. Mais même
si ça a été le cas, il n'en reste
plus qu'un aujourd'hui, celui que vous pouvez observer
en cliquant sur le lien à gauche. Ce code est dit
universel,
il est le même pour tous les êtres vivants.
Si
la vie existe ailleurs dans l’univers, on ne sait
pas si elle est basée, comme la nôtre, sur
une information génétique faite d’ADN
et, si c’est le cas, si le code est le même
que le nôtre.
|
|
Voyez,
par exemple, la
séquence de nucléotides codant pour
les acides aminés de la calmoduline,
une enzyme intervenant dans la régulation de l'activité
de plusieurs enzymes.
Bien
sûr, l'ADN est constitué de deux chaînes
complémentaires. L'information n'est portée que
par une des deux chaînes, parfois l'une, parfois l'autre.
La chaîne complémentaire au message est là
pour stabiliser la molécule et lui permettre de se reproduire
(réplication).
Le
segment d'ADN correspondant à la recette d'une protéine
est appelé gène. Le segment d'ADN
ci-dessous correspond donc au gène de la protéine
PHE-ARG-LEU-PHE-LEU
Gène
de la protéine PHE-ARG-LEU-PHE-LEU.
L'information est portée par le brin du bas (et elle se
lit dans la direction 3' - 5' ). Le brin du haut
sert à stabiliser la molécule et lui permet de se
reproduire.
L'ADN
constitue donc une information miniaturisée (le minuscule
noyau d'une cellule peut contenir des dizaines de milliers de
gènes différents). Et le plus beau de l'histoire,
c'est que cette information peut en plus se reproduire !
|
|
Attention,
le segment d'ADN codant pour la cystéine (CYS), ce n'est
pas de la cystéine, pas plus que le mot "pomme"
n'est une pomme.
Le
triplet de nucléotide ACG désigne
la cystéine, ce n'en est pas!
Voir
: La
structure de l'ADN et le code génétique (cliquez
sur "Codon", le dernier bouton à droite).
Et
si on mettait tout ça en musique?
Transcriptions
The Music of Protein Sequences
Des
biologistes à l'esprit musical ont eu l'idée
de mettre les protéines en musique. Ils ont assigné
une note de musique à chacun des vingt acides aminés
de sorte que la séquence de la protéine
devienne la partition de la pièce musicale. La
durée de la note est déterminée par
le nombre de triplets d'ADN codant pour l'acide aminé
correspondant. Par moment, une harpe accompagne la note
en jouant des notes correspondant aux nucléotides
codant pour l'acide aminé. Les structures secondaires
de la protéine (hélices alpha ou feuillets
bêta) correspondent à des notes jouées
par des instruments d'accompagnement. Les régions
hydrophobes ou hydrophiles peuvent aussi intervenir. Enfin,
consultez cette page
du site pour plus de détails sur les règles
musicales appliquées et pour écouter quelques
exemples. Le résultat est assez étonnant!
Plusieurs autres protéines musicales sur
cette page.
|
Évitez
une erreur fréquente, souvent vue dans les journaux :
ne confondez pas code génétique et information
génétique. Le code génétique,
c'est la correspondance entre un triplet de nucléotides
et un acide aminé. Ce code est le même pour tous
les êtres vivants. L'information génétique,
c'est la séquence des nucléotides, les recettes
de protéines. L'information génétique n'est
pas la même d'un être vivant à l'autre (sauf
les clônes comme les jumeaux identiques).
|
Un
gène = l'information complète, sous
forme d'ADN, nécessaire pour synthétiser une
protéine.
Ex.
gène
du lysozyme, gène du collagène, gène
de l'insuline, etc.
Cette
définition n'est pas tout à fait exacte comme
nous le verrons plus loin.
On
ignore le nombre total de gènes contenus dans le
génome humain. Les dernières estimations avancent
un chiffre variant entre 30 000 et 40 000. Certains
auteurs croient qu'il y en aurait plus. Ces gènes
ne représentent qu'environ 1% du total de l'ADN du
génome. 3% correspondrait à des séquences
qui contrôlent l'expression des gènes. Le 96%
restant n'a pas de rôle dans la synthèse des
protéines. Une partie joue un rôle dans le
repliement et la séparation des chromosomes au cours
de la division cellulaire et ce qui reste ne semble pas
avoir de fonction (nous y reviendrons).
À lire et à visionner:
Le génome au propre
Un
document tiré de l'émission Découverte
de Radio-Canada. Visionnez le reportage vidéo (cliquez
sur l'icône au bas de la page)
|
Combien
de nucléotides contiendrait
un gène codant pour une protéine de 100 acides aminés? |
©
Gilles Bourbonnais / Cégep de Sainte Foy |