Génôme 1 .pdf



Nom original: Génôme 1.pdf

Ce document au format PDF 1.4 a été généré par , et a été envoyé sur fichier-pdf.fr le 24/09/2013 à 15:06, depuis l'adresse IP 194.199.x.x. La présente page de téléchargement du fichier a été vue 1071 fois.
Taille du document: 8.5 Mo (30 pages).
Confidentialité: fichier public


Aperçu du document


L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

SCIENCES BIOLOGIQUES : GENOME ET
EPIGENOME
SOMMAIRE
I­ Introduction et Rappels
II­ Deux questions différentes mais interdépendantes
1. Hérédité : « Transmission des caractères »
2. Relation génotype­phénotype

Page 1 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

I­ Introduction
   L'organisme humain est le résultat d'une évolution basée sur des milliards d'années. D'après Théodosius
Dobzhanski : « Rien n'a de sens en biologie, si ce n'est à la lumière de l'évolution ».
   Il faut donc avoir une connaissance de l'ensemble de l'évolution des concepts et aussi de la description
de Charles Darwin qui fut une vraie révolution de la pensée en biologie, une révolution qui s'étend bien
au­delà de la notion d'évolution des espèces.
   En premier lieu, nous allons voir  les grandes transitions conceptuelles accompagnant le développement
de la révolution biologique.
● Au XVIIIème siècle, la notion prédominante par rapport au vivant était le fixisme, c'est­à­dire
qu’une fois l’espèce créée, elle ne se développe plus. Elle a eu une activité extrêmement
importante dans la description et la classification du vivant. Ce concept a quand même permis
de classer les espèces et de générer les questions qui ont fait évoluer cette idée. Les noms
associés à ce concept de fixisme sont : Georges de Buffon, Carl Linné, Bernard de Jussieu,
Georges Cuvier.
● Au début du XIXème siècle, avec notamment Lamarck, le transformisme a commencé à
prendre corps et à remplacer la vision fixiste. Cela est en relation avec l'évolution de la vie, de
la religion. Le transformisme, déjà suggéré par Buffon de manière plus discrète, va prendre
corps : les espèces changent tout le temps. L'explication fournie et proposée à cette époque
c'est que le milieu a un rôle fondamental, que son action est déterminante pour faire évoluer les
espèces : c'est une théorie « instructiviste ». C'est­à­dire qu'à partir d'éléments de
l'environnement, il y a des changements qui se font et qui deviennent héréditaires.
L'autre terme plus savant est le terme d'essentialisme : on considère que les espèces existent réellement,
qu’elles sont créées par l'Homme quand il observe ce qui l'entoure dans la nature. Autrement dit, la
définition d'espèce est contingente avec la démarche d'exploration par le cerveau humain.
Tout le monde avait constaté qu'au sein d'une même espèce il y avait une variabilité considérée comme
secondaire et comme un désordre négligeable.
● L'apport essentiel de Darwin est d'avoir considéré que ce qui était important n'était pas
tellement l'organisation de l'espèce mais la variabilité des individus. Sachant qu'à l'intérieur
d'une espèce, ce qui la caractérise c'est la moyenne et l'écart type par rapport à l'ensemble des
individus.
Donc la première inspiration, c'est la variabilité des individus qui est l'élément clé sur laquelle doit reposer
une réflexion pour expliquer le transformisme. Deuxième élément clé, c'est que cette variabilité vient d'un
phénomène de descendance avec modification : d'une génération à l'autre, des modifications dues au
hasard se mettent en place, elles ne sont pas dirigées par un but précédent l'apparition. On a la notion de
sélection naturelle : l'environnement exerce sur ses populations une pression qui va faire que les variants les
plus adaptés à une condition de milieu particulière vont « apparaître ». L'environnement va sélectionner ces
variants et de ce fait, va donner une meilleure adaptation aux conditions environnementales.
         Pour résumer, les deux notions clés de la réflexion de Darwin sont : la variabilité des individus et la
sélection naturelle.
   On a énormément développé la pensée de Darwin par la suite. En effet, on a développé, entre autres, la
Page 2 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

notion d'eugénisme au début du XXème siècle : c'est la sélection active. Cette notion d'application d'une
sélection active dans la population humaine n'est absolument pas dans la pensée de Darwin.
   Le concept de la variabilité des individus issu de la sélection naturelle est une notion fondamentale dans la
pensée biologique d'une manière générale et pas seulement pour fournir une explication ou une
interprétation à l'évolution des espèces mais également applicable pour la population cellulaire. Cette
variabilité est au premier plan de l'explication que l'on peut donner au développement d'une tumeur avec
l'accumulation de variants cellulaires à partir d'un tissu donné et un microenvironnement qui va exercer une
pression de sélection. Des chercheurs ont appliqué cette notion avec les interactions moléculaires : des
protéines acquièrent leur conformation active avec leur partenaire (l'environnement).
● Darwin ne savait pas quels étaient les mécanismes de transmission des variants génétiques. Par
contre Weismann, au début du XXème siècle, à  partir des reconnaissances des lois de
Mendel et aussi de l'observation des chromosomes, a commencé à mettre en place le
Néodarwinisme : les variants phénotypiques dont parlait Darwin, sont le résultat de mutations
génétiques transmissibles selon les règles de loi de Mendel. On a donc donné un appui matériel
à la transmission des caractères.
   Ces mutations génétiques se produisent « au hasard » par rapport aux besoins adaptatifs.
● Il aura fallu attendre le milieu du XXème siècle pour que soit formulée par Julian Huxley et ses
successeurs la « Théorie Synthétique Moderne de l’Évolution » qui a fait converger la théorie
Darwinienne, la connaissance des mécanismes de transmission héréditaire et également des
mécanismes de développement.
● Theodosius Dobzhanski a travaillé sur l'existence de micromutations et sur le fait qu'à chaque
génération, il y a 1 nucléotide sur 10^8 qui subit une modification. Se développe aussi la
théorie de la spéciation avec l'influence du milieu et l'isolement géographique. A la suite d'un
événement, quand une espèce se retrouve isolée, elle va évoluer différemment du reste de
l'espèce qui se trouve dans un autre environnement. Pareillement, se développe la génétique
des populations.
● En 1969, Motoo Kimura proposait que des variants puissent apparaître et se stabiliser en
absence de sélection naturelle : c'est la théorie neutraliste dans laquelle les variants apparaissent
par mutation et persistent. La théorie neutraliste n'est pas en contradiction avec l'intervention de
la sélection naturelle puisqu'il peut y avoir les deux phénomènes concomitants.
● Ernest Mayr en 1942, étudie les relations entre macro­ et microévolution.
● En 1970, Stephen Gould et Niles Eldredge travaillent sur les équilibres ponctués. Darwin était
gradualiste : il proposait que l'évolution des espèces se fasse pas à pas avec une cinétique très
très lente. Gould et Eldredge sont pour que la stabilité d'une espèce se fasse sur une très
longue période, suivie d'une variation brutale d'une espèce.
   Toutes ces révolutions conceptuelles et cette stabilisation de la théorie de Darwin aboutissent, à l'heure
actuelle, à faire une nouvelle classification du vivant. Le fait que l'on puisse maintenant travailler sur des
génomes entiers et comparer les génomes entre les espèces et les génomes entre les individus d'une même
espèce, a permis de développer un champ d'investigation concernant l'évolution des génomes et l'évolution
de leur fonction.

Page 3 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

II­ Deux questions différentes mais interdépendantes
1.  Hérédité : « Transmission des caractères »
   La question de la transmission des caractères est relativement bien comprise. En 1865 (presque au
même moment où Darwin publie l'origine des espèces (1859)), Gregor Mendel étudie la transmission de
certains caractères par une analyse statistique grâce à laquelle il propose les lois fondamentales de la
génétique.
   Ce que G. Mendel nous montre, c'est que l'hérédité est particulaire : les transmissions des caractères
reposent sur la transmission d'entités discrètes que l'on appellera plus tard les gènes.
● La loi de la ségrégation des caractères héréditaires : il a étudié le croisement de deux lignées
pures qui présentaient des traits différents pour un même caractère. A la première génération,
on a des individus qui présentent un seul trait. Par contre, à la deuxième génération, les deux
traits réapparaissent. A partir de là, naît la notion d'intégrité du support de la transmission
héréditaire qui est conservée, et cela donne la notion de traits dominants et récessifs.
Ce constat conduit à fonder l'idée d'une hérédité.

Ségrégation

Page 4 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

● La loi de disjonction et de réassortiment de couples de caractères héréditaires (que  l'on
appelle aussi la répartition indépendante) : le croisement de lignées pures qui diffèrent par deux
ou plusieurs caractères met en évidence  le comportement indépendant de chacun de ces
caractères.

Répartition indépendante

Page 5 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

Ces lois de Mendel sont restées ignorées pendant quasiment 30 ans. Vers 1900, on a une redécouverte
des lois de Mendel. On cherche donc comment les caractères peuvent être transmis à la naissance. En
1909, Johannsen va lui­même introduire les termes de « gènes », « génotype » et « phénotype ». Selon les
propositions de Johannsen, les caractères héréditaires sont portés par des unités discrètes et
indépendantes, ce qui est compatible avec le discours de Mendel : elles sont présentes par paires et se
séparent au cours de la formation des gamètes.
   Ces unités discrètes (séparées l'une des autres) sont maintenant appelées « gènes » et les différentes
formes d'un gène sont les « allèles » qui sont soit dominants soit récessifs.
   Progressivement, on s'est aperçu que la transmission d'un nombre important de caractères obéissait à
des notions plus complexes, ce qui complète ce que l'on vient de voir :
● On a des interactions entre allèles qui traduisent le phénomène de dominance incomplète.
● Certains allèles ont des effets phénotypiques multiples : pléiotropie
● De nombreux gènes ont des allèles multiples : polymorphisme génétique
● Il y a des caractères polygéniques : ils vont assurer une variation continue en fonction de la
combinaison des allèles des gènes.
● Il y a des interactions gènes / environnement. Ce dernier va agir sur l'expression phénotypique.
On aura alors une variation d'expression.
● L'hérédité non­mendélienne est la notion d'empreinte parentale, à savoir que pour certains
gènes, c'est soit l'allèle maternel soit l'allèle paternel qui va être fonctionnel au final. Cette notion
est connue pour un certain nombre de gènes et qui a un impact très important.
● L'hérédité mitochondriale avec les gènes mitochondriaux, transmis par la mère.

   La théorie chromosomique de l'hérédité s'est développée très largement au XXème siècle notamment
Page 6 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

avec les travaux de Thomas Morgan puisqu'il travaillait sur un organisme : la drosophile. L'avantage c'est
que l'on obtient très rapidement une grande population de drosophiles.
   Morgan élabore le fait que les modifications du génotype sont liées à des modifications, situées dans les
locus. Un locus est un emplacement sur un chromosome qui, altéré par une mutation, entraîne une
modification du phénotype.
● Liaison génétique (linkage) : certains gènes sont transmis simultanément (co­ségrégation), en
raison de la proximité physique de leurs loci sur les chromosomes (un ensemble complet de
loci sur un chromosome donné constitue un groupe de liaison). Pour la drosophile qui a 4
chromosomes, il y aura 4 groupes de liaisons. Pour les humains, c'est donc plus compliqué.
● Recombinaison génétique : la liaison complète est très rare, car une recombinaison génétique
peut avoir lieu, résultat d'un échange entre deux chromosomes homologues au cours de la
prophase de méiose I (crossing­over).
   La fréquence de recombinaison des loci est d'autant plus grande que les loci sont éloignés l'un de l'autre
sur le chromosome.
   La détermination des fréquences de recombinaison permet d'établir des cartes génétiques, dont l'unité est
le centimorgan (cM), correspondant à une fréquence de recombinaison de 0,01 (1 chance sur 100 qu'une
recombinaison ait lieu). En 1913, on a la première carte linéaire de gènes par Sturtevant.

   La question qui se posait était : quelle est la nature du support moléculaire de l'hérédité ? (l'élément clé
qui permet le transfert de génération en génération).

Page 7 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

   On peut citer 3 expériences qui tentent de répondre à cette question :
● 1928 : Expérience de Griffith : un facteur particulier d'une souche virulente (L) de
pneumocoque peut transformer une souche non­virulente (R) en souche virulente.
● 1944 : Avery, MacLeod, McCarthy montrent que le facteur transformant est l'ADN.
● 1952 : Hershey et Chase démontrent définitivement le rôle informatif de l'ADN.
   Ce sont 3 découvertes majeures, 100 ans après la théorie de Darwin.
   L'immense majorité des organismes vivants possède un génome ADN (certains génomes viraux sont
constitués d'ARN).
   La question qui se posait c'était : l'ADN est bien le support moléculaire de l'hérédité mais pourquoi ?!
Qu'elles sont les caractéristiques structurales qui permettent d'expliquer cette hérédité.
   L'analyse sur la composition moléculaire de l'ADN par Chargaff et son équipe a permis de voir la
proportion des différentes bases sur l'ADN et surtout le rapport A/T et G/C. Chargaff a montré que c'était
particulier et intrigant que ce rapport soit égal à 1 quelle que soit l'espèce que l'on considère.
Ce constat a été l'élément déclencheur pour dire qu'il y avait une association particulière entre A et T & G
et C.

Parallèlement, Rosalind Franklin avait essayé de comprendre ce qu'il y avait derrière ces diagrammes de
diffraction qui suggérait une structure hélicoïdale.

   Watson et Crick ont eu l'inspiration de proposer la structure de la double hélice pour expliquer la
périodicité et l'appariement des bases. La séquence des bases sur un des brins n'est soumise à aucune
restriction. On peut avoir toutes les combinaisons d'une séquence en base. Il peut y avoir une information
considérable stockée simplement dans la séquence en base le long d'un brin de l'ADN. Ils proposent les
Page 8 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

conséquences de la double hélice : si on connaît la séquence d'un brin on connaît bien sûr la séquence de
l'autre ! Il a été montré que le rapport de bases A/T ou G/C est égal à 1, ce qui explique la structure en
double hélice.
   Dans la même publication en 1953, Watson et Crick vont mettre le doigt sur ce qui permet d'expliquer la
transmission des caractères : la réplication semi­conservative de l'ADN. Ils disent : « ils ne nous a pas
échappé que cet apparaiement spécifique suggère immédiatement un mécanisme possible de copier du
matériel génétique ». Chaque brin de la double hélice sert de matrice  pour la synthèse de nouveau brin.
   Après, il a fallu confirmer que la réplication était bien semi­conservative : en 1958, les travaux de
Meselson et de Stahl démontrent la validité de l'hypothèse de la réplication semi­conservative. Chaque brin
d'ADN parental sert de matrice pour la synthèse d'un brin complémentaire.

 En 1955, la biologie moléculaire se met en place car Kornberg purifie la
première ADN polymérase à partir d'E. Coli (500 mg à partir de 100kg),
c'est à dire la première enzyme capable de catalyser cette réplication
semi­conservative.

   La réplication semi­conservative pose un problème car les deux brins sont
antiparallèles et donc, si les nouveaux nucléotides sont introduits du côté 3' et que la fourche de réplication
s'ouvre dans un sens (voir schéma ci­dessous), ça va synthétiser en continu mais l'autre brin pose un
problème car il ne peut pas y avoir de synthèse du coté 5'. Un brin est synthétisé de manière continue et
l'autre de manière discontinue (fragments d'Okasaki).
Page 9 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

   Le processus de réplication créer des cassures simple brin tant que ces points d'Okasaki ne sont pas
réparés et collés les uns aux autres.

   La solution au problème topologique est amenée par Okasaki qui démontre la présence de fragments.

   Il n'a pas été facile de convaincre les scientifiques que la réplication d'une molécule aussi fondamentale
que l'ADN pouvait se faire de manière discontinue sur un des brins parce qu'il y a une contradiction avec la
notion de transmission intégrale du matériel génétique de génération en génération avec la notion de
cassure.
   Toutes ces découvertes se heurtent avec les concepts préexistants, et cela permet de dépasser cette
ancienne vision.
   Ces travaux ont permis à la biologie moléculaire de devenir une science fondamentale.
Page 10 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

Développement des techniques de manipulation de l’ADN
● Werner Aber (Prix Nobel 1978) : Enzymes de restriction, qui permettent de couper la double hélice
d'ADN en des sites bien spécifiques.
● 1972 ­ Stanley N Cohen,Paul Berg, Herbert Boyer : Technique de l’ADN recombinant : on peut
introduire un fragment d’ADN dans un plasmide, qui, introduit dans des bactéries, est reproduit et
peut être traduit en une protéine recombinante.
● 1977 ­ Maxam et Gilbert Frederick Sanger : Méthodes de séquençage de l’ADN.
● 1982 ­ Création de la banque de données GenBank : Cartographie moléculaire de gènes.
● 1983 – Kary Mullis (Prix Nobel 1993) : Invention de la Polymerase Chain Reaction (PCR) :
méthode permettant de recopier un très grand nombre de fois une région de l’ADN, utilisation
d’une polymérase thermosensible pour amplifier de manière spécifique une région donnée de
l’ADN (un gène, une région de gènes…). Cette méthode est aussi utilisée pour les ARN,
développement de la RT­PCR (reverse transcription), cette méthode permet de partir d’un ARNm
d’en faire un ARN complémentaire et cet ARN complémentaire peut être soumis à PCR. (en
résumé : ­ PCR : pour L’ADN  ­ RT­PCR : pour l’ADN complémentaire issu d’un ARN)
● 1986 : ­ Premier séquenceur automatique :
Séquences de génomes
■ 1995 : Hemophilus influenzae 1,83 106 paires de bases
■ 1996 : Saccharomyces cerevisiae 13 106 paires de bases
■ 1998 : Caenorhabditis elegans
■ ….
■ 2004 : Homo sapiens : version complète : 3 109 paires de bases dans le
génome haploïde.
A l’heure actuelle on peut séquencer plusieurs génomes en une semaine, alors
qu’il a fallu plusieurs années pour séquencer un seul génome. La montée en puissance
des technologies a complètement révolutionné l’étude du génome.
­ Puces à ADN permettent, grâce au collage sur des réseaux tridimensionnels de petites
séquences, de reconnaitre dans un échantillon donné la séquence de telle ou telle séquence
complémentaire. A l’heure actuelle elles permettent de repérer des variations dans les
séquences de dizaines de milliers de gènes en même temps.
           ­ Puces à protéines, qui permettent de faire la même chose, mais pour les protéines.
On est passé, en une trentaine d’années, de méthode très artisanale à des méthodes à très haut débit. On
est maintenant dans l’ère des séquenceurs de la prochaine génération. On peut produire un très grand
nombre de données mais le problème est qu’il faut les moyens pour les analyser.

Page 11 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

La grande évolution du 20ème siècle a était d’une part de pouvoir établir une cartographie mais aussi de
bâtir des cartes de restrictions.

Page 12 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

Dans le schéma de gauche, il est indiqué le nombre de génome complet que l'on a pu séquencer entre
2000 et 2009 : un peu plus de 500 en 2000 et 4000 en 2009.
Dans le schéma de droite, le nombre de séquençage possible par jour et par machine.
J. Craig Venter, un de ceux qui ont séquencé le génome humain, l'a fait de manière indépendante. Il a
séquencé son propre génome et il publie : «  les données du génomique vont devenir banales, le prochain
défi, lié à la variation génétique humaine avec la physiologie et les maladies, sera le plus grand défi que les
spécialistes du génome auront à relever. »
Il est très facile d’accéder à des séquences du génome mais la question de la relation génome­phénotype
reste ouverte à l’heure actuelle et ne sera surement pas résolue d’ici 10 ou 20 ans.

2. Relation génotype ­ phénotype
Page 13 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

Mise en balance de 2 périodes conceptuelles différentes : celle qui vient de s’écouler et celle que l’on
aborde : l’ère post­génomique. On a constaté au XXème, avec l’aide de la génomique puis que la biologie
moléculaire, que la physiologie a était relégué au 2nd plan, du fait de la puissance de développement de la
génétique et de l’apparente solidité des concepts qui étaient derrière.
1950­1960 : Révolution conceptuelle, à la base de l’émergence de la biologie moléculaire
Le concept général de spécificité comme base du fonctionnement des êtres vivants vient supplanter la
vision préexistante, selon laquelle les mécanismes biologiques sont des processus hautement fluides et
interactifs (issue notamment du constat que certaines mutations ont des effets pléiotropes).
Concept générale de spécificité moléculaire :
C’est le fait qu’il y ait une relation entre la séquence et la structure macromoléculaire. Le fait que les
reconnaissances entre une protéine et son ligand soient basées sur la stéréospécificité.
La spécificité des interactions des enzymes­substrats (modèle de la clé et de la serrure) et la spécificité de
la relation récepteur­ligand.
Le terme de spécificité, issue du XIXème siècle, se renforce au XXème siècle, notamment grâce au
développement de la biochimie et de la biologie moléculaire. Et cela donne aussi en biologie moléculaire
une tentative de liaison entre le génotype et le phénotype qui s’exprime de la manière suivante :

Un gène – Une enzyme – Un caractère
Cela est vrai dans un certain nombre de cas mais ce n’est pas une généralité.

Les concepts qui en découlent :
● Les mécanismes biologiques résultent d’assemblages d’éléments, dont chacun joue un rôle
spécifique et restreint.
● La spécificité est le critère décisif et attendu : cela à une action très sélective en vue des
découvertes.
La découverte d’une action pléiotrope restreint l’importance accordée à un gène.
● La séquence (nucléotides et acides aminés) est l’identité. Chaque individu va être considéré à
travers la séquence de son génome. Lien entre séquence et identité.

Les mutants permettent d’explorer la relation génotype – phénotype.
Page 14 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

Paradigme du « réductionnisme génétique » : un gène va coder pour une protéine. Ces protéines vont
s’assembler de manière spécifique et cela va donner lieu à un fonctionnement cellulaire bien particulier :
comme le montre le schéma de gauche, on passe d’un niveau à un autre grâce à la spécificité.
Ce concept a permis à la biologie d’évoluer dans la 2ème partie du XXème siècle.
Cependant, le tout n’est pas la somme des parties et c’est là que ce paradigme est mis à mal.

L’approche génétique pour expliquer les phénomènes biologiques :
Utilisation des différences génétiques naturelles (polymorphismes, mutations,…) et artificielles
Recherche génétique :
→ Génétique directe (variants phénotypiques normaux et « anormaux ») :
Découvrir la voie normale métabolique, physiologique, ou de développement. On
essaye donc de trouver la voie qui est modifié ou qui fait les différences entre
plusieurs phénotypes.
→ Génétique inverse : basée sur l’étude de l’ADN
Découvrir les conséquences d’une modification d’une séquence normale de l’ADN
■ Création de mutations : pour observer les conséquences de ces mutations.
■ Utilisation de divergences naturelles au niveau génomique (ex Chimpanzé /
Homme)

À la fin du XXème siècle…
Page 15 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

La métaphore du « programme génétique » (au sens d’un ensemble d’instructions contenu dans le
génome. Celles­ci vont permettent de réaliser une action), renforcée par le succès des techniques de
génie génétique, a une forte influence conceptuelle.
La relation génotype ­ phénotypes repose simplement sur la mise en route de ces instructions. Cette thèse
s’appuie essentiellement sur l’instruction : tout serait contenu dans le génome et il suffirait de lire les
instructions pour que ces actions se mettent en place.
Le gène est défini comme un élément invariable et unitaire de structure mais aussi comme un lieu
d’actions causales reliant gène et caractère de manière déterministe.
Il existe un déterminisme génétique très fort derrière cette façon de penser.
L’analyse génétique des phénotypes complexes débouche sur des modèles basés sur l’existence de
« voies » (« pathways »), au sein desquelles chaque élément (le produit d’un gène) occupe une
place déterminée.

→ Analogie issue de la génétique du métabolisme organisée en voies biochimiques (gènes codant pour les enzymes).

Le fonctionnement cellulaire s’explique par la circulation d’une information au travers de « voies de
transduction du signal »
La représentation suivante est un exemple de cette théorie.

Page 16 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

Ils ont travaillé sur un champ conceptuel basé sur la spécificité d’interaction, sur la notion de séquences
définissant l’identité et les différentes instructions du génome. Cette approche a été extrêmement
productive en informations et connaissances mais le problème est, qu’après avoir séquencé pas mal de
génomes (qui étaient la démarche logique), ils se sont posés un certains nombres de questions. Voir
Page 17 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

citations ci­dessus.
Le séquençage du génome humain a soulevé plus de question qu'il en a résolue. Le bénéfice réside dans
l’évolution de la réflexion.

Pas de lien direct entre complexité d’organisation et taille du génome

Il n’y a pas de lien direct entre la taille du génome et la complexité d’organisation. De manière
concentrique, on considère que l’organisme humain est le système le plus complexe et le plus sophistiqué.
Quand on regarde la taille des génomes, on remarque que des protozoaires ont des tailles de génomes bien
supérieurs au génome humain. Les génomes des mammifères se situent à la médiane en termes de tailles
par rapport à tous les génomes observés.
 Il n’y a donc pas de lien entre tailles des génomes et l’information contenue dans le génome.
2ème surprise de la génétique : le nombre de gènes n’est pas en lien avec ce que l’on peut considérer
comme étant la complexité d’organisation.

Page 18 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

Le nombre de gènes codant pour les protéines de C. elegans et le même que nous.
Ce n’est pas non plus dans le nombre de gène codant pour les protéines qui va falloir rechercher les
sources de la complexité phénotypique.
Ce qui est intéressant c’est le pourcentage d’ARN non codant, les séquences qui codent réellement pour les
protéines de l’homme sont juste de 2%.
Qu’est­ce que fait le reste ? Il vient à l’idée que quelque part dans le génome non codant, il  y a des choses
inscrites qui peuvent jouer un rôle dans l’organisation de l’espèce et dans les degrés de complexité.
Toutes ces régions non codantes en dehors des séquences répétitives, des introns, on les a appelées le
« junk DNA » (ADN poubelle) à partir du moment où l’on propose que les régions de l’ADN où on ne
sait pas à quoi elles servent, on est encore dans le concept d’une spécificité relié aux gènes classiques
(codant pour les protéines). Aujourd’hui plus personne ne parle de junk DNA.
Corps humain : ~ 1013 cellules

LE GENOME HUMAIN
Il y a 2 génomes chez les eucaryotes :
Génome nucléaire

~3,2 109 paires de bases pour un génome
haploïde

24 molécules linéaires (chromosomes)

Génome mitochondriale
ADN circulaire, 16 659 paires de bases
~10 copies par mitochondries
~ 8 000 copies au total
Page 19 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

(22 autosomes, 2 chromosomes sexuels X et Y)
Cellules somatiques diploïdes : 46
chromosomes (2 copies de chaque autosome +
XY ou XX)
Gamètes haploïdes : 23 chromosomes

Le génome nucléaire humain est constitué à plus de 90 % de séquences dont on
ignore la fonction

Les régions UTR : untranslated regions

Gènes codant pour des protéines

Page 20 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

● La version 2004 du catalogue génomique (Ensembl 34d) contient 22 287 loci géniques (34 214
transcrits, soit 1,54 transcrit par locus), représentant 19438 gènes connus et 2 188 gènes prédits.
● Fourchette pour l’estimation du nombre de gènes : 20 000 à 25 000
● Ces loci ont 231 667 exons, soit ~ 10,4 exons par locus, et 9,1 exon par transcrit
● La longueur totale couverte par les exons codants est de ~ 34 Mb, soit 1,2 % du génome
chromatique
● Les régions non traduites des transcrits couvrent une longueur estimée de ~ 21 Mb, soit 0,7 % du
génome euchromatique.

Taille des gènes humains
Actuellement, quand on emploie le mot gène on parle des gènes codants pour les protéines.
La taille des gènes humains est extrêmement variable. :
● Gènes très courts (moins 10 kb). Ex : tRNA, insuline, chaine β de l’hémoglobine, HLA, etc…
● Gènes moyennement longs (10­100 kb). Ex : apolipoprotéine B, récepteur LDL, etc…
● Gènes longs (100­1000 kb). Ex : facteur VIII de coagulation sur X (hémophilie A), fibrose
cystique (CFTR), phénylalanine hydroxylase, etc…
● Gènes très long (plus de 1000 kb). Ex : dystrophine (le plus long connu), en Xp21.2­3 plus de 2
Mb (14 kb de région codante), responsable des maladies de Duchenne et Becker s’il est
défectueux.

Page 21 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

On a recherché les cadres ouverts de lecture qui sont limités par un codon start et un codon stop, ces
codons starts et stops étant dans un certains contexte de séquence. On peut, par des moyens statistiques
allé chercher de manière systématique ces codons.
Autre moyen pour aller rechercher les séquences codantes : la distorsion des codons. Les séquences
codantes sont soumises à une pression de sélection importante de l’activité codante. D’autre part, par
rapport au reste du génome, on va retrouver dans ces séquences codantes, des séquences distordues  par
rapport aux triplets que l’on va retrouver ailleurs dans le génome. En recherchant de manière statistique des
distorsions, on peut trouver des régions codantes.
Les frontières entre les exons et les introns ont des séquences spécifiques. On peut repérer de manière
automatique ces régions. Si on est sur une frontière exon­intron c’est que l’on est à l’intérieur d’un gène.
En amont d’un gène, il y a des séquences régulatrices (boîtes TATA, boîtes régulatrices…). En les
recherchant, on peut confirmer que l’on est à proximité d’un gène.
Concernant l’approche zoologique, si on a des gènes connus, et que l’on sait probablement qu’au cours de
l’évolution, qu’ils se sont répliqués, on peut les rechercher, là aussi, par des méthodes statistiques.
Repérer et confirmer où sont situés des gènes dans une séquence génomique est un travail fastidieux.
La version 2004 du catalogue des gènes :
● ~ 22 mille loci géni ce qui correspond à 34 mille transcrits, tel que l’on pensé avant 2004.
● Conduit à l’estimation de 20 à 25 mille gènes.
● A peu près 10 exons par locus.
● 9 exons par transcrits
● La longueur  totale recouverte par des exons codant est de 34 Mb, c’est­à­dire seulement 1,2 %
du génome euchromatique (lorsque l’on exclut les zones répétitives)
● Les régions non transcrites et non traduites couvrent 0,7% du génome

Page 22 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

Organisation des gènes humains
Les gènes humains sont de tailles extrêmement variables.
Les gènes humains sont constitués de petits exons d’environ 50 codons (ou environ 200 paires de bases)
séparés de longs introns, et occupent une grande place sur le génome, typiquement de l’ordre de 28 kb.
Les nombres d’exons sont généralement corrélés à la taille des gènes, et varient d'un exon pour les plus
petits gènes à de nombreux exons pour les plus grands. Ex : le gène de la dystrophine à 79 exons.

Certains gènes humains sont chevauchants. Ex : gènes de classe III du système HLA.
Certains gènes humains sont imbriqués les uns dans les autres. Ex : l’intron 27 (40 kb) du gène NF1 de
la neurofibromatose contient 3 autres petits gènes.

Pseudogènes :
Copies complètes ou partielles de gènes incapables de coder pour des
polypeptides fonctionnels.
Deux types :
● Conventionnels : issus de duplications segmentaires complètes
ou partielles, suivies d’une perte de fonction par mutation ; une
petite proportion de gènes peuvent rester fonctionnels
(apparition de nouvelles fonctions ou de nouveaux profils
d’expression).
● « Modifiés » (processed) : ils n’ont pas d’introns, formés par
rétrotransposition d’ARN matures, ils s’intègrent au hasard
dans le génome.
Un pseudogène modifié ne contient aucun intron, et en général ne
possède pas de promoteur mais quelques cas de « rétrogènes »
actifs ont été cependant décrits dans certains organismes.
Page 23 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

● La séquence pratiquement complète du génome humain rend possible la recherche systématique de
pseudogènes (source de la surestimation initiale du nombre de gènes fonctionnels codant pour des
protéines).
● A l’heure actuelle, ~ 20 000 pseudogènes conventionnels et modifiés ont été identifiés :
pseudogènes de grande taille récemment apparus ; pseudogènes plus petits et/ou plus anciens.
● Ce nombre est sous­estimé, les analyses actuelles ne pouvant détecter les pseudogènes très
anciens ou contenant principalement des régions non­traduites : il est probable que le nombre de
pseudogènes dépasse le nombre de gènes fonctionnels.
● Non contraints par la sélection (théorie de l’évolution neutre) : accumulation de mutations
(insertions, délétions, substitutions).

ADN répété

L’ADN répété correspond à la moitié du génome.
● Séquences répétées en tandem : ADN satellite (6,5 %)
● Eléments transposables (44 %) : véritable bombe à retardement du génome car la réactivation de
ces éléments transposables peut conduire à une instabilité génétique.

Page 24 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

ADN satellite (6,5 %)
■ ADN alphoïde : répétition en tandem de motifs de 171
paires de bases au niveau des centromères.
■ Minisatellites hypervariables (Variable Number of Tandem
Repeats) : séquences répétitives dispersées dans
l’ensemble du génome, et très polymorphes.
■ Minisatellites télomériques : copies multiples du motif
5’­TTAGGG­3’ situées à l’extrémité des chromosomes.
■ Microsatellite (short tandem repeat) : répétitions en tandem
d’un motif court, présents en grand nombre de fois dans le
génome :
(CA)n:(GT)n : 1 tous les 25 – 100 kb ; 8 Mb au total,
soit 0,25 % du génome très polymorphes.
(A)n:(T)n : ~ 120 000 copies, 0,15 % du génome.
Autres…
Quand on casse l’ADN en fragments et que l’on fait une centrifugation en gradient de densité, on a une
bande principale et des bandes satellites qui sont centrifugées à des vitesses différentes. Ce sont les bandes
satellites qui contiennent l’ADN répété.

Eléments transposables
44 % du génome humain,  ce qui est considérable.

Page 25 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

Les éléments transposables sont de 2 types : les rétrotransposons et les transposons à ADN.
Répétitions dispersées sur le génome

Eléments transposables (44 %)
● Autonomes : 1000 à 20 000 nucléotides : codent les protéines nécessaires à la mobilité de
l’élément et à son insertion en un nouveau site.
● Non autonomes : 100 à 1000 nucléotides : utilisent les protéines codées par les autres transposons.
Rétrotransposons : ils se propagent grâce à une rétrotranscription (transcription inverse) de l’ARN
transcrit du transposon, en un nouvel ADN.
● LINE (Long Interspersed Nuclear Element) (640 Mb) : codent pour une enzyme
multifonctionnelle qui, outre son activité transcriptase inverse, reconnaît et coupe l’ADN. Ex.
LINE 1 : 6,1 kb, 516 000 copies.
● Rétrotransposons à LTR (Long terminal Repeats) (250 Mb) : codent 5 protéines différentes,
dont trois enzymes : protéase, transcriptase inverse, intégrase (analogie avec des rétrovirus).
● SINE (Short Interspersed Nuclear Elements) (420 Mb) : utilisent la transcriptase inverse codée
par d’autres rétroéléments. Ex. : Alu

Page 26 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

Insertion de copies entières, tronquées, ou
plus grandes si la transcription a dépassé les
limites du transposon.

N°1

L’enzyme de LINE­1 reconnaît n’importe quel
ARNm transcrit d’un gène quelconque et peut en
faire un pseudogène.

● Rétrotransposons, taille du génome et
remaniements génomiques.

Les rétrotransposons (LINE­1) entraîneraient de recombinaisons inégales lors
de la formation des gamètes

● Les transposons pourraient jouer le rôle de sites homologues lors de la recombinaison.
Page 27 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

● Leur répartition aléatoire entraînerait des échanges chromosomiques inégaux.
● Certains événements de recombinaisons échapperaient à l’élimination par la sélection
naturelle, et conduiraient à des chromosomes remaniés de façon durable.
Transposons à ADN (90 Mb) : codent pour une transposase qui reconnaît les extrémités de l’élément,
l’excise, et l’insère ailleurs (transposition conservative ou réplicative).

Transposons à ADN et évolution du génome
● Création de macrotransposons, constitués de deux transposons de la même famille et de la
région génomique encadrée : déplacement en bloc d’une fraction non négligeable du génome.
● Création de réseaux de régulation génique : la transposase d’un transposon ayant perdu sa
mobilité (b), peut se fixer sur le motif unique de transposons ayant perdu l’autre site et jouer le rôle
de facteur de transcription (c).
● Création de nouveaux gènes codant des protéines dotées d’un domaine de fixation à
l’ADN : la séquence d’un transposon mobile mais « dégénéré », codant pour le domaine de
fixation à l’ADN de la transposase, peut être insérée à côté d’autres gènes dont les protéines
auront acquis la fonction de facteurs de transcription.

Page 28 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

Après ce magnifique cours de Gauduch’ voilà de quoi se détendre.

Page 29 sur 30

L2 Pharmacie – Sciences Biologiques : Génome et Epigénome
18/09/2013 – Pr Gauduchon
Groupe 7 – Alexandre & Jason

N°1

Bon courage :­) et tout spécialement pour Sami !

Page 30 sur 30


Génôme 1.pdf - page 1/30
 
Génôme 1.pdf - page 2/30
Génôme 1.pdf - page 3/30
Génôme 1.pdf - page 4/30
Génôme 1.pdf - page 5/30
Génôme 1.pdf - page 6/30
 




Télécharger le fichier (PDF)


Génôme 1.pdf (PDF, 8.5 Mo)

Télécharger
Formats alternatifs: ZIP



Documents similaires


genome 1
heintzman2009 nature histone mod enhancers cell type specificity
novo1
crisp chine 2
nar lncrnabioinfo 1
bactibase a new web accessible database for bacteriocin

Sur le même sujet..