Une large population de transcrits non-codants identifiés par RNA-seq chez l’Hydre

  • news
A large population of putative non-coding transcripts identified by RNA-seq in Hydra

Dans une étude récente publiée dans le journal BMC Genomic, Yvan Wenger et Brigitte Galliot décrivent une méthode simple et efficace pour combiner les technologies de séquençages «Illumina» et «454». Cette méthode est utilisée pour produire un transcriptome fidèle et étendu du cnidaire Hydra vulgaris.

Ce transcriptome contient 48'909 séquences uniques en tenant compte des variants d’épissage, ces séquences correspondent à environ 24'450 gènes. Les auteurs ont ensuite comparé ce transcriptome RNA-seq à celui publié par Chapman et al. (Nature 2010), qui lui est dérivé de séquences génomiques. En comparaison, le transcriptome RNA-seq contient 10'597 transcrits nouveaux, c’est-à-dire non prédits par Chapman et al., mais dont le gène est néanmoins présent dans les séquences génomiques. Seul 5% de ces nouveaux transcrits encodent des protéines conservées au cours de l’évolution que l’on retrouve chez d’autres organismes, alors que la grande majorité (7'103 séquences) n’encode pas de protéine (cadres de lecture ouvert de moins de 100 acide aminés). Au moins 767 de ces séquences sont des pseudogènes, alors que 81 d’entre elles correspondent à de longs RNAs non-codants (lncRNA).

A l’inverse, 11'270 transcrits prédits ne sont pas identifiés dans le transcriptome RNA-seq. Ces transcrits peuvent provenir de gènes non exprimés dans les échantillons RNA-seq, par exemple gènes activés par une condition de stress non présente lors de l’échantillonnage, ou alors de gènes ancestraux, toujours contenus dans le génome mais qui ne sont plus exprimés aujourd’hui.

En résumé, la comparaison entre les répertoires de transcrits obtenus par RNA-seq ou ceux prédits en utilisant des séquences génomiques aboutit à l’identification de larges populations de transcrits spécifiques à l’une ou l’autre des méthodes, et l’analyse de ces transcrits permet de faire des hypothèses testables en terme de régulation et d’évolution de ces gènes.