Les virus à ARN : « mieux les connaître pour mieux les combattre »
Le séquençage à Haut débit (HTP : high throughput) de l’ADN conduit à l’accumulation importante de données. Cependant, pour les virus à ARN il en va autrement. Bien que les premières séquences génomiques aient été disponibles il y a longtemps, en raison d’un manque d’effort concerté, les données de séquence des virus à ARN sont à la traîne par rapport aux autres organismes. Ceci est en partie dû à la difficulté et au coût liés au travail sur ces virus souvent hautement pathogènes exigeant des conditions de sécurité élevées, telles que celles trouvées dans des laboratoires de type P3 ou P4. De plus, la stratégie massive et automatisée de séquençage utilisée pour de grands génomes d’ADN, n’est pas applicable aux génomes courts des virus à ARN.
Selon le comité international de la taxonomie des virus, plus de 350 espèces de virus qui possèdent un génome à ARN et qui peuvent infecter les vertébrés ont été décrits à ce jour (ceci n’inclut pas les rétrovirus et les virus de poissons), mais seulement 30% ont vu leur génome séquencé. Un nombre équivalent d’espèces supposées reste à être classifié et séquencé. Les évènements récents ont montré que la plupart des virus pathogènes émergents (virus de l’hépatite C, virus de la dengue/West-Nile, virus Ebola, virus Nipah et Hendrah, coronavirus du SRAS (SARS-CoV), etc...) sont des virus à ARN. Ceci est une conséquence de leur énorme diversité génétique et de leur tendance naturelle à évoluer rapidement.
Il est largement accepté que notre connaissance de l’évolution virale est directement liée à la quantité et à l’analyse des données génomiques. En particulier, l’analyse complète de génomes a révélé la présence d’événements discontinus d’évolution tels que la recombinaison et le réarrangement de gènes, qui peuvent jouer un rôle majeur dans la diversité des virus à ARN, la virulence et la spécificité pour leur hôte.