Sorbonne Université

Master de Sciences & Technologies

M2 Mathématiques & Applications (Sorbonne Université)

Arbres aléatoires pour la biologie évolutive

A. Lambert Sorbonne Université

L'objectif de ce cours :

Ce cours a pour but d’étudier et de comprendre les propriétés mathématiques de certains arbres aléatoires notamment utilisés en biologie évolutive pour modéliser les généalogies, les pedigrees ou les phylogénies.

Thèmes abordés :

La majeure partie du cours sera consacrée aux arbres aléatoires discrets, dont nous introduirons les trois principales classes de modèles : les modèles de dynamique des populations (processus de Galton–Watson, processus de naissance et de mort, ‘splitting trees’), les modèles de génétique des populations (modèles de Cannings, Wright–Fisher, d’Eldon–Wakeley) et les modèles d’arbres phylogénétiques (‘Markov branching models’ d’Aldous). Dans le cas des processus de branchement, nous montrerons comment le processus de contour d’un arbre permet d’en extraire certaines propriétés.

La plupart de ces arbres aléatoires sont interprétés dans leur définition primitive comme la trace de la dynamique d’une population de particules (une particule pouvant être la copie d’un gène, une cellule, un organisme individuel, ou une colonie d’individus, voire une espèce) qui meurent et se reproduisent au cours du temps. Un rôle particulier est joué en biologie évolutive par l’arbre réduit, qui est l’arbre généalogique des particules vivantes à un temps donné. Nous étudierons deux exemples d’arbres réduits dont il existe une description très élégante dans le sens rétrospectif du temps : le coalescent de Kingman et le processus ponctuel de coalescence.

La troisième partie du cours sera consacrée à l’étude fine des topologies des arbres aléatoires que nous avons introduits, en particulier dans le cadre des ‘Markov branching models’. Nous étudierons notamment le comportement d’une mesure de déséquilibre des arbres communément appelée.

Dans la quatrième partie du cours, les particules seront munies de types héritables (haplotype, trait phénotypique), et nous caractériserons la partition allélique de la population, prise dans sa totalité ou à temps fixe. Cette partie fait intervenir des objets très importants en génétique des populations et en probabilités discrètes, comme le processus du restaurant chinois, la formule d’échantillonnage d’Ewens ou la distribution de Griffiths-Engen-McCloskey (GEM). Si le temps le permet, nous terminerons par l’étude de certaines limites d’échelle de ces arbres : processus de branchement

Référence : http://www.lpma-paris.fr/dw/doku.php?id=users:amaury:nmx06