Distribution de MetaPIGA2, un logiciel pour la reconstruction de très grands arbres phylogénétiques

  • news
Release of MetaPIGA2, a software for very large evolutionary tree reconstruction

La reconstruction de l’arbre de l’évolution (la phylogénie) est très difficile car le nombre de solutions potentielles augmente de manière explosive avec le nombre d’espèces ou séquences analysées. En effet, il y a près de 32 milliards de phylogénies possibles et différentes pour juste 14 espèces/séquences… et environ 3 x 1084 phylogénies (c.a.d., plus que le nombre d’atomes dans l’univers) pour 55 séquences/espèces. Cela rend la tâche des phylogénéticiens très difficile surtout depuis les avancées majeures en biologie moléculaire et en biotechnologie qui ont généré un accroissement massif du nombre de séquences disponibles. C’est pourquoi, une proportion majeure des activités de recherche en  ‘phyloinformatique’ (c.à.d., la phylogénie computationelle) porte sur le développement d’heuristiques plus efficaces, c.à.d. des algorithmes qui produisent des solutions optimales, ou proches de l’optimal, avec une grande probabilité… et dans des temps de calculs informatiques acceptables.

MetaPIGA2 implémente le metaGA (algorithme génétique métapopulationnel)

Nous annonçons la distribution du logiciel  metaPIGA2 qui implémente une série d’opérateurs qui imitent les processus biologiques de l’évolution tels que les mutations, la recombinaison, la sélection, et la reproduction. Ici, les “individus” en évolution sont les topologies des arbres et les paramètres du modèle qui doivent être optimisés. Une mutation est une modification aléatoire d’un composant de l’individu, et la probabilité de survie d’un individu est une fonction de sa Vraisemblance (une mesure mathématique). Grâce à la sélection, le score moyen de la population s’améliore avec le temps, c.à.d., d’itération en itération dans l’ordinateur.

MetaPIGA2 améliore très significativement la vitesse et l’efficacité avec lesquelles les arbres phylogénétiques sont reconstruits (de telle manière que des centaines ou des milliers d’espèces /de séquences peuvent être analysées simultanément en des temps de calcul raisonnables). Le principe majeur de la procédure consiste à forcer les populations de solutions au sein de l’ordinateur de coopérer dans la recherche des meilleures phylogénies.

Références:

  • Le Logiciel MetaPIGA2 est décrit dans:
    Helaers R. & M.C. Milinkovitch
    MetaPIGA v2.0: maximum likelihood large phylogeny estimation using the metapopulation genetic algorithm and other stochastic heuristics
    BMC Bioinformatics 2010, 11: 379
  • Le logiciel metaPIGA et son manuel sont disponibles gratuitement à www.metapiga.org.
  • L'algorithme metaGA est décrit dans:
    Lemmon A. R. & M. C. Milinkovitch
    The metapopulation genetic algorithm: an efficient solution for the problem of large phylogeny estimation
    PNAS, 99: 10516-10521 (2002)