Génome humain : Du séquençage au décryptage, un grand pas reste à franchir

Publié le 03/01/2001
Article réservé aux abonnés
1276304817Img18811.jpg

1276304817Img18811.jpg

L E programme de séquençage du génome humain a été accéléré ; sa vocation profondément politique a été réaffirmée. Lancé sous les auspices de l'UNESCO voici une dizaine d'années, alors que, pour des raisons de moyens autant que de représentation de l'intérêt général, personne n'imaginait que le séquençage puisse être autre chose que l'affaire de la puissance publique, le programme international a vu l'arrivée de Celera-Genomics, entreprise privée qui, comme telle, n'est pas prédestinée à distinguer nettement le « patrimoine de l'humanité » de celui de ses investisseurs. Son patron, Graig Venter, individu à la fois médiatique et secret, s'est pourtant fendu, au printemps dernier, à l'Institut Pasteur, d'une annonce en deux points : premièrement, Celera disposerait déjà d'une première ébauche de la séquence humaine ; deuxièmement, cette séquence sera publiée (sans précision de date). A vrai dire, nul n'a pris trop au pied de la lettre ces déclarations, assez clairement destinées à rassurer, l'une, les investisseurs, l'autre, les pouvoirs publics américains, plutôt irrités par l'entrisme pratiqué par Graig Venter dans un domaine aussi sensible politiquement - Al Gore, notamment, a toujours farouchement défendu une recherche publique.

Un séquençage accéléré

Les organismes publics, NIH américain et Wellcome Trust britannique en tête, ont dû néanmoins réagir et accélérer leur propre programme. Alors que le projet initial prévoyait le séquençage redondant de fragments d'ADN humains (portés par des chromosomes bactériens) représentant statistiquement de huit à dix « équivalents génome », pour obtenir un degré élevé de précision dès le premier passage, il a été décidé, pour aller plus vite, de se contenter de 5 équivalents génome. La totalité de ces séquences permet de couvrir environ 90 % du génome. C'est ce dont on dispose aujourd'hui dans les banques de données publiques.
Conséquence de ce séquencage accéléré : les séquences publiées sont en fait de qualité très inégale. Il peut s'agir de séquences considérées comme pratiquement « finies », telles les séquences complètes des chromosomes 21 et 22, publiées cette année. Il peut aussi s'agir de simples ébauches, comportant des erreurs plus ou moins nombreuses, et qui correspondent à des fragments d'ADN qu'il faudra réordonner les uns par rapport aux autres pour reconstituer leur enchaînement dans le génome. Ce premier séquencage, rendu nécessaire pour des raisons de contexte, devra donc être suivi d'un second, avant même le travail de « finition » des séquences, visant à combler les « trous » restants. On estime que ce travail demandera encore deux ou trois ans. Mais au moins, d'ici là, la recherche publique aura pris les devants en publiant un premier jet de séquences.
Pour l'heure, comme l'a rappellé Jean Weissenbach devant l'Académie de médecine (Journée Génomique et Médecine, 10 octobre), « la biologie est en train de passer d'une phase où les limitations portaient sur le volume des données à une phase où nous sommes limités par notre capacité d'analyse ». Dans les séquences, en effet, ce sont les gènes que l'on cherche et, derrière ces gènes, des fonctions ou des phénotypes.
L'identification des gènes dans une séquence « au long cours » est un premier problème. Qu'il s'agisse des programmes informatiques capables de repérer dans l'enchaînement des bases les motifs caractéristiques des séquences codantes, de la recherche d'analogies avec des gènes connus dans d'autres organismes ou encore de la comparaison entre ADN et transcrits cellulaires, aucune méthode ne semble suffisamment sensible et spécifique. La fourchette plus que large des estimations du nombre de gène que comporte le génome humain, entre 28 000 et 120 000, montre bien la difficulté et les aléas de l'identification des gènes dans les séquences.

Caractériser les fonctions des gènes

Après l'identification des gènes vient le deuxième problème : la caractérisation de leurs fonctions, c'est-à-dire du phénotype associé à l'expression de chacun ou, plus exactement, de la part qui relève de chacun dans le phénotype d'un individu. Plusieurs méthodes sont possibles pour approcher les fonctions, mais aucune ne paraît capable de l'analyse systématique qui sera nécessaire. En génétique médicale, l'identification d'un gène muté dans une maladie indique « en creux » la fonction qu'il assure à l'échelle du phénotype. Ce schéma vaut toutefois essentiellement pour les maladies monogéniques. Pour les maladies multifactorielles, environnementales et polygéniques, les attributions des traits phénotypiques sont naturellement beaucoup plus équivoques.
Les animaux knock-out, qui constituent aujourd'hui le mode d'étude le plus répandu de la fonction des gènes, ne sont que des modèles artificiels de pathologie génétique : ils supposent, eux aussi, que le génome puisse se ramener à une juxtaposition de gènes s'exprimant chacun pour son propre compte, sans interaction entre gènes et sans rétroaction de l'environnement sur le gène. Modèle sans doute simpliste. En outre, le parallélisme avec l'espèce humaine que supposent toujours d'admettre les modèles animaux est ici particulièrement sujet à caution, puisque c'est justement le génome qui détermine l'espèce, et donc les différences entre espèces. S'il y a toujours une approximation à se servir d'une autre espèce comme modèle, la transposition à l'homme devient franchement hasardeuse si elle concerne justement ce qui caractérise l'espèce.

Des combinaisons à l'infini

La complexité n'est pas en soi chose nouvelle en biologie. La nouveauté est peut-être qu'il va falloir cette fois embrasser toute la complexité. Le génome ressemble à une combinatoire comportant plusieurs dizaines de milliers d'entrées et à l'intérieur de laquelle sont essentiellement ignorées les régulations internes au génome et les régulations épigénétiques, qui intègrent le gène dans un environnement et le distinguent d'une pièce rapportée.
Le problème est celui de la méthode empirique. Va-t-on étudier tous les gènes un à un, puis deux à deux, trois à trois, etc. ? Naturellement, des rapprochements sont possibles, par grande catégorie métabolique. Ces catégories interagissent toutefois elles aussi entre elles. Si bien que c'est peu ou prou toutes les combinaisons d'inactivation qu'il faudrait en théorie tester. L'hypothèse est simplement inenvisageable. Et c'est sans doute heureux, puisqu'on ne verrait pas sans inquiétude la recherche en génétique se transformer en une vaste entreprise de tératogénie.

Du nématode à l'homme

L'inactivation des gènes reste pourtant bien le projet pour accéder aux fonctions. Des techniques d'inactivation systématique commencent à être mises en œuvre. Elles ont ainsi permis, en novembre dernier, de cerner les fonctions de plusieurs centaines de gènes sur les chromosomes I et III de Caenorhabditis elegans, un nématode dont la séquence génomique est entièrement connue. Il ne s'agit toutefois que d'un dégrossissage : de tel gène, on aura, par exemple, appris que son inactivation est létale à tel stade du développement embryonnaire. La donnée est utile lorsque l'on part de rien. Mais sa précision reste limitée. En outre, quelle que soit la précision à laquelle on finira par aboutir dans la description des fonctions des gènes de C. elegans, la transposition au génome humain ne permettra jamais que de décrire ce qui reste du nématode dans l'individu, quand, de l'un à l'autre, il faut bien reconnaître qu'une certaine évolution est passée sous les ponts.
Pour le moment, donc, s'il existe bien des techniques qui permettent de préciser indirectement et jusqu'à un certain point la fonction de divers gènes, on voit mal ce qui pourrait conduire à un décryptage fonctionnel intégral du génome, dont on aura décrypté la séquence nucléotidique. Il est vrai que l'on a aussi parlé de tâche impossible pour le séquençage, lors du lancement du programme, et que le travail a en fait progressé nettement plus rapidement qu'initialement prévu. Le problème posé est toutefois radicalement différent dans un cas et dans l'autre. L'analyse structurelle, le séquençage, est réductionniste par essence. L'analyse fonctionnelle vise, au contraire, à observer la partie intégrée dans le tout. Or c'est là ce que la biologie ne sait pas faire : elle ne sait en fait que regarder la partie, une fois éliminé le tout (dissection), ou, au contraire, regarder un tout amputé d'une de ses parties (modèle knock-out). L'observation à plusieurs échelles - le gène dans l'individu, parce que c'est « son » gène -, est un problème fondamental non résolu, mais qui risque de ne plus pouvoir être esquivé longtemps lorsqu'on se retrouvera au pied du mur, muni de la séquence du génome. L'immensité de la tâche, s'il ne fallait compter que sur la méthode empirique, et l'impossibilité, de toute façon, d'aboutir à des caractérisations précises des fonctions qu'on inactive sont des problèmes dont la plupart des chercheurs sont bien conscients. La recherche d'approches prédictives de la fonction des gènes apparaît aujourd'hui comme le principal défi de l'après-séquençage.

Vincent BARGOIN

Source : lequotidiendumedecin.fr: 6828