Séquençage de l'ARNLe séquençage de l'ARN (RNA-Seq, de l’anglais RNA sequencing), également appelé séquençage aléatoire du transcriptome entier (whole transcriptome shotgun sequencing en anglais)[1], est une technologie qui utilise le séquençage à haut débit (next-generation sequencing en anglais) pour identifier et quantifier l'ARN issu de la transcription du génome à un moment donné[2]. IntroductionLe transcriptome d'une cellule est dynamique, en constante évolution. Les technologies de séquençage à haut débit ont permis la lecture de l'ADN d'une cellule, base par base. Ces technologies permettent également la lecture de l'ARN dans une cellule, ce qui facilite la compréhension des mécanismes d'épissage alternatif de gènes, comprenant les modifications post-transcriptionnelles, les gènes de fusion, les polymorphismes nucléotidiques (SNP en anglais) et les changements dans l'expression génique[3]. En plus de l'ARNm, la technologie RNA-Seq permet d'identifier d'autres types d'ARN, tels que les microARN (miRNA en anglais), l'acide ribonucléique de transfert (ARNt, tRNA en anglais) et l'ARN ribosomal (ARNr, rRNA anglais)[4]. La technologie du RNA-Seq est utile pour déterminer les marges exon/intron des gènes et pour vérifier la localisation des extrémités 5' et 3' annotées antérieurement. Les études réalisées avec la technologie RNA-Seq comprennent l'observation des changements qui se produisent dans une cellule au cours d'infections [5] et des changements dans l'expression génique pour les études portant sur le cancer[6]. Avant l'arrivée des technologies de séquençage à haut débit, les études de masse portant sur l'expression des gènes étaient principalement réalisées par le biais de la technologie des puces à ADN. MéthodologieLa méthodologie générale du RNA-Seq est décrite ci-contre. La méthode la plus courante est celle visant les ARN polyadénylés car ceux-ci représentent les ARNm stables et donc non ciblés pour dégradation, qui correspondent donc principalement à des ARNm dont le but est la traduction en protéine. De plus, la sélection des ARN polyadénylés permet l'élimination des ARN ribosomaux qui ne sont pas sujets à ce phénomène [7]. À noter qu'il existe d'autres protocoles ayant pour cible d'autres ARN, notamment les micro-ARN, ainsi que les ARN naissant ou encore ARN non codants. Enfin, bien que la méthode la plus courante vise l'ARN total d'une cellule, il existe certains protocoles visant à isoler les ARN nucléaires ou cytoplasmiques, selon le cadre de l'étude[8]. Des études portant sur des portions du transcriptome non polyadénylé ont montré que lors de l'utilisation de billes magnétiques poly(T), l'écoulement traversant peut contribuer à la découverte de gènes non-codants importants qui auraient autrement été manqués[10]. De plus, l'ARN ribosomal représentant plus de 90 % de l'ARN total d'une cellule donnée, des études ont montré que son élimination par le biais d'hybridation de sondes spécifiques visant ces ARN augmente très sensiblement la capacité d'un séquençage RNA-Seq à cibler le reste du transcriptome. L'étape suivante est la transcription inverse (reverse transcription en anglais), qui vise à convertir les ARN en ADNc. Pour corriger le biais 5' de la transcription inverse provenant d'amorces aléatoires, et aussi bien pour réduire la formation de structures secondaires influençant les sites de liaison des amorces [11], une hydrolyse de l'ARN en fragments de 200-300 nucléotides est généralement utilisée de manière à résoudre ces problèmes potentiels. Cependant, il existe des limitations à cette méthode: même si de manière générale le corps des transcrits (correspondant au corps du gène) est converti efficacement en ADNc, il en va de moins pour les extrémités 5' et 3'. Les chercheurs choisiront donc d'appliquer ou d'ignorer cette étape selon les objectifs établis au cours d'une étude donnée. Une fois l'ADNc synthétisé, celui-ci peut être fragmenté davantage de manière à atteindre la longueur de fragment désirée pour le système de séquençage utilisé, comme par exemple la technologie Illumina. Le séquençage permet alors d'évaluer l'abondance des transcrits de chaque gène, c'est-à-dire le nombre de fois qu'un même transcrit a été séquencé. Ainsi, il est possible de déterminer l'expression relative des gènes dans une condition physiologique donnée, en comparaison à une condition physiologique de référence. Notes et références
Voir aussiInformation related to Séquençage de l'ARN |