pan-Aves


Zleva doprava: ara hyacintový (Anodorhynchus hyacinthinus), zdroj: flickr.com (JMJ32); Gigantoraptor a Alectrosaurus, autor Luis V. Rey
Zobrazují se příspěvky se štítkemDatace. Zobrazit všechny příspěvky
Zobrazují se příspěvky se štítkemDatace. Zobrazit všechny příspěvky

Zrychlená morfologická evoluce podporuje výjimečnost ptáků a ptačí linie v rámci teropodů

    Brusatte a spol. analyzují rychlost morfologické evoluce na přechodu od neptačích dinosaurů k ptákům. Autoři se tak snaží otestovat hypotézu G. G. Simpsona, podle které je vznik nového tělního plánu doprovázen "vlnami" zrychlené morfologické evoluce.

Slepice (Gallus gallus f. domestica), konfuciusornitid Zhongornis (považovaný ovšem i za "přechodný článek" mezi dlouho- a krátkoocasými ptáky nebo dokonce skanzoriopterygidního oviraptorosaura – viz níže) a bazální eudromeosaur Bambiraptor. Tři zástupci extrémně úspěšného kladu Paraves, který se zdá v teropodní evoluci zaujímat zvláštní místo a blízko jehož báze došlo k převratným změnám v dinosauřím tělním plánu a tempu morfologické evoluce. (Zdroj: Ksepka 2014: Figure 1, kredit: Jason Brougham)

1. Fylogenetická analýza – matice a metodologie

    Základ jejich studie tvoří značně rozšířená verze datové matice TWG (Theropod Working Group). Ta je dlouhodobým – nyní již zhruba 20-letým – projektem skupiny výzkumníků soustředěné okolo American Museum of Natural History. Během těchto dvaceti let se matice postupně rozrůstala, až donedávna se ale stále potácela okolo 350 znaků. S prvním velkým rozšířením přišli Turner et al. (2012), kteří TWG zkombinovali s ptačí datovou maticí Clarke et al. (2006) a dostali se tak na celkových 474 znaků. (Viz ale recenzi této studie od Mickey Mortimerové, podle které se spojení obou matic autorům úplně nepovedlo a mnohá chybějící data ve výsledné supermatici chyběla zcela zbytečně.) Brusatte a spol. ale zacházejí ještě daleko dále: nejenže rozšířili matici na celkových 853 znaků, se kterými už konkuruje Megamatrici Andrey Cau'a, ale také významně zvýšili její taxon sampling. Ke vzorku Turnera a spol. Brusatte et al. (2014) přidávají hned 41 nových taxonů a jejich celkový počet tak zvyšují na 152. Zde dokonce Brusatte a spol. Megamatrici výrazně překonávají – ta ve své poslední publikované verzi (Lee et al. 2014) zahrnovala "jen" 120 taxonů z celého kladu Theropoda, zatímco nová studie se omezuje na celurosaury. S výjimkou dvou loni popsaných paravianů – eosinopteryga a aurornise (Godefroit et al. 2013a,b) – se na tomto přírůstku podílejí čistě bazální zástupci celurosaurů, jako jsou tyrannosauroidi nebo ornitomimosauři. Zatímco předchozí verze TWG matice se zaměřovaly na příbuzenství v rámci paravianů (tj. mezi dromeosauridy, troodontidy a avialami), Brusatte a spol. pokrývají celurosaury daleko uniformněji. Zatímco kódování paravianů nebylo změněno téměř vůbec a kódování non-paravianních maniraptorů jen málo, na kódování bazálních celurosaurů si autoři dali záležet – důkladně jej překontrolovali a v případě potřeby změnili. Konečně 5 taxonů žijících ptáků bylo kódováno "konzervativně", což znamená, že všechny znaky, kde jsou přesné homologie s bazálními celurosaury nejisté (jako je tomu např. u kůstek v ptačím zápěstí), byly kódovány jako neznámé.
    Brusatte a spol. pro svou analýzu používají metodu maximální parsimonie, která podle očekávání odkryla velké množství optimálních (nejkratších) stromů. Svou analýzu znakové evoluce autoři zakládají na jediném náhodně vybraném stromu z tohoto vzorku, a její robustnost vůči fylogenetické nejistotě ověřují tím, že jí zopakují pro 9 dalších náhodně vybraných stromů. Bayesovská analýza, která poskytuje vzorek aposteriorního rozdělení (tj. tisícovky stromů, které sice nejsou optimální, ale mají k optimu blízko), by byla pro tyto účely zřejmě vhodnější. Bayes by navíc umožnil odhadnout fylogenezi a její dataci současně (a to tak, že nejistota ve fylogenezi by byla vyintegrována při odhadu datace, a nejistota v dataci vyintegrována při odhadu fylogeneze), zatímco strom vzešlý z analýzy metodou nejvyšší parsimonie je třeba datovat v odděleném kroku pomocí jedné ze specializovaných škálovacích (time-scaling) metod (viz např. Bapst 2014 nebo nedávný článek o tip-dating metodách zde na blogu). Tuto výhodu bayesovského přístupu nedávno demonstrovali Lee et al. (2014) ve studii, o které budu ještě muset napsat více.

1.1 Fylogenetické výsledky

    V hlavních rysech je kladogram Brusatteho a spol. konzervativní. Nejbazálnějším celurosaurem (a jediným zástupcem této skupiny, který stojí mimo Tyrannoraptora) je Bicentenaria (na blogu viz zde), která si zde ve srovnání s původní analýzou Novase a spol. (2012) prohodila místo s tugulusaurem. V pěkné ukázce toho, jak vzácné jsou robustní výsledky v analýzách s velkým objemem chybějících dat, označují autoři bazální pozici bisentenárie za "well-supported" (Brusatte et al. 2014: S13), přestože její jackknife* je roven 65% a rozkladový index 2 – na stromě s celkovou délkou 3360 kroků! Tugulusaurus a Zuolong spolu s tyrannosauroidy a maniraptoriformy tvoří polytomii u báze Tyrannoraptora. Nerozřešené zůstávají příbuzenské vztahy na bázi maniraptoriformů (mezi kompsognátidy, ornitolestem, maniraptory a ornitomimosaury), maniraptorů (mezi terizinosaury, alvarezsauroidy a pennaraptory) a eumaniraptorů (mezi dromeosauridy, troodontidy a avialami). Stejně jako Megamatrice a na rozdíl od analýzy Turnera a spol. (2012) nová fylogeneze podporuje velmi široký rozsah tyrannosauroidů, do kterých spadají klady Coeluridae (CoelurusTanycolagreus) i Proceratosauridae (Guanlong a příbuzní, více zde) stejně jako opeřený Dilong. Podpora pro tyrannosauroidní příslušnost dilonga a proceratosauridů už je přitom skutečně slušná; jackknife zde činí 82%. Nqwebasaurus vyšel stejně jako v Choiniere et al. (2012) na pozici nejbazálnějšího ornitomimosaura.

Striktní konsenzus 99999 nejúspornějších stromů, vzešlých z analýzy 853 znaků a 146 ingroup taxonů (z nichž Unenlagia a Neuquenraptor jsou spojeni do jediného OTU), a posteriori ořezané o 5 "wildcard" taxonů. Čísla pod větvemi udávají podporu jednotlivých uzlů ve tvaru "rozkladový index/jackknife". Uzly bez čísel mají rozkladový index rovný 1 a jackknife pod 60%. (Modifikováno z Brusatte et al. 2014: Figures S1 a S2)

*Jackknife je metoda, která pomáhá odhadnout nejistotu v situaci, kdy analýzu nelze jednoduše zopakovat nad jinými vzorky stejné velikosti. Do úspornostní fylogenetiky ji zavedl Farris jako konkurenci pro bootstrap svého nesmiřitelného rivala, Joe'a Felsensteina. Stejně jako bootstrap i jackknife patří do širší rodiny neparametrických metod založených na resamplingu. Bootstrap z datové matice tahá s opakováním, dokud nevytvoří nový, fiktivní dataset – "pseudoreplikát" – o stejném počtu znaků. Jackknife místo toho určité procento náhodně vybraných znaků vyřadí z analýzy, takže pseudoreplikát je menší než původní matice. Z obou metod je jackknife používán méně; jeho statistické vlastnosti silně závisejí na tom, jaké procento znaků je vyřazeno (Felsenstein 2004).

1.2 Oviraptorosauři a skanzoriopterygidi

    Zřejmě největší překvapení se vyskytují uvnitř kladu Pennaraptora, tvořeného oviraptorosaury a paraviany. Brusatte a spol. jako jedni z mála do své analýzy zahrnuli taxon Pedopenna, který nenajdeme dokonce ani v Megamatrici (nebo aspoň v její ořezané, publikované verzi). Původní popis (Xu & Zhang 2005) pedopennu odkryl v trichotomii s avialami a deinonychosaury a trvalo devět let, než byla tato pozice ověřena další nezávislou studií. Foth et al. (2014) letos v létě odhalili pedopennu jako zástupce kladu zahrnujícího taxony Anchiornis, Xiaotingia a Eosinopteryx, který formoval sesterskou skupinu k "Archaeopteryx node". Brusatte a spol. ji nyní odkrývají v sesterském vztahu se skanzoriopterygidem epidexipterygem na samé bázi oviraptorosaurů.
    Ačkoli skanzoriopterygidi v předchozích verzích TWG matice vycházeli jako bazální avialy (např. Xu et al. 2011; Novas et al. 2012) a jednou jako non-eumaniraptoří paraviani (Turner et al. 2012), jejich příslušnost k oviraptorosaurům není úplnou novinkou. Andrea Cau v roce 2010 na svém blogu Theropoda poukázal na to, že skanzoriopterygidi, oviraptorosauři a sapeornitidi – nejbazálnější skupina krátkoocasých ptáků – sdílejí krátkou, hlubokou lebku se zvětšenými premaxillárními zuby, a navrhl existenci skupiny "Magnoviraptorosauria", která by tyto tři taxony spojila. Test v Megamatrici ale tuto hypotézu přesvědčivě zamítl ve prospěch konvenční fylogeneze. Xu et al. (2010; na blogu viz zde) navrhli podobnou hypotézu, ve které klad (Oviraptorosauria + Scansoriopterygidae) tvořil sesterskou skupinu ke kladu složenému z jeholornise a krátkoocasých ptáků; nepodpořili ji ale numerickou analýzou. Stejným nedostatkem trpí i letošní krajně pochybná analýza O'Connorové a Sullivana (2014), která v plném rozsahuje obnovuje hypotézu Magnoviraptorosauria, s tou výjimkou, že místo sapeornitidů v hypotetickém kladu figuruje Zhongornis – autoři nedokázali donutit matici Xu'a a spol. (2011), aby jim očekávaný výsledek odkryla. Agnolín & Novas (2013) se svou upravenou verzí TWG matice sesterský vztah mezi oviraptorosaury a skanzoriopterygidy skutečně odhalili, ale oviraptorosauři – stejně jako nyní u Brusatteho a spol. – zůstali ve své klasické pozici mimo Avialae. Brusatte et al. (2014) podotýkají, že skanzoriopterygidy přetahují do oviraptorosaurů hlavně znaky související s jejich krátkou a hlubokou lebkou (stejně jako v předchozích studiích) a že je tato pozice mimořádně slabá: jackknife klesl pod 50% a stačí jediný krok navíc, aby výsledný klad zkolaboval.

1.3 Báze Paraves

    Zajímavé výsledky se vyskytují i uvnitř eumaniraptorů. V posledních několika letech bylo z Číny popsáno několik drobných maniraptorů, kteří začali stírat hranici mezi deinonychosaury a ptáky: Anchiornis (Xu et al. 2008; viz článek na minulé verzi blogu), Xiaotingia (Xu et al. 2011; na blogu viz zde), Eosinopteryx (Godefroit et al. 2013a) a Aurornis (Godefroit et al. 2013b). Zatímco první dva z těchto taxonů se ještě povedlo zakomponovat do tradiční fylogeneze s jasně oddělenými dromeosauridy, troodontidy a avialami (Hu et al. 2009; Lee & Worthy 2011 – viz zde; Senter et al. 2012; Turner et al. 2012; Spencer & Wilberg 2013), s popisem eosinopteryga a aurornise se zdálo, že se paravianní fylogeneze změnila v dlouhý hřebínek, táhnoucí se od "tradičních" deinonychosaurů (kteří jsou sami parafyletičtí, neboť troodontidi mají k ptákům blíž než dromeosauridi) k bazálním avialám typu archeopteryga nebo jeholornise (Godefroit et al. 2013b; Foth et al. 2014; Lee et al. 2014; viz i Agnolín & Novas 2013). Brusatte a spol. nyní prezentují teprve čtvrtou (AFAIK) studii, která zahrnuje celou čtyřku problematických čtyřkřídlých opeřenců (Anchiornis, Aurornis, Eosinopteryx, Xiaotingia), a její výsledky jsou až neuvěřitelně nudné. Všechny tyto taxony jsou navzájem svými nejbližšími příbuznými (jejich přesné vzájemné vztahy zůstaly nerozřešené) a formují klad na samé bázi troodontidů. Rovněž Archaeopteryx tentokrát odolal svému občasnému pokušení přeskočit k deinonychosaurům (Xu et al. 2011; Godefroit et al. 2013a).
    Je tedy snad stále moc brzy na to, abychom zahazovali tradiční paravianní fylogenezi? Nemyslím si. Shoda mezi největší publikovanou datovou maticí (Lee et al. 2014) a nezávislou, ale rovněž obří maticí Fotha a spol. (2014; 560 znaků) je příliš působivá, než aby ji šlo ignorovat*, a břímě důkazu tak zůstává na zastáncích tradičního uspořádání – přestože Brusatte et al. (2014) v tomto ohledu určitě podnikají krok správným směrem.

*Mickey Mortimer na DML navíc podotkla, že matice Fotha a spol. nejenže je úplnější, ale také v průměru kvalitněji kódovaná než matice Turnera a spol., jejichž kódování paravianů ponechávají Brusatte a spol. beze změny.

1.4 Ptáci

    Co se ptáků týče, poměrně pochybnou se zdá být pozice sapeornise, který má k pygostylianům dál než Jeholornis. To by znamenalo, že k drastickému zkrácení ocasní části páteře došlo v ptačí evoluci dvakrát nezávisle na sobě, či případně (a ještě nepravděpodobněji) že Jeholornis svůj dlouhý kostěný ocas vyvinul nanovo. Brusatte et al. (2014) také neodkrývají monofyletické songlingornitidy a Lithornis – normálně pokládaný za létavého paleognáta a snad i za zástupce kmenové linie tinam (Mitchell et al. 2014)* stojí mimo korunní klad ptáků (Neornithes). Tento výsledek je v celé komplikované historii, která za maticí Brusatteho a spol. stojí, novinkou – Clarke et al. (2006) odhalili litornise jako paleognáta a Turner et al. (2012) stále aspoň jako neornita (stojícího v polytomii s neognáty a tinamou, jediným zahrnutým paleognátem). Pravděpodobně jde však čistě o důsledek znakového samplingu, který je uzpůsoben spíš k rozřešení velkoškálových vztahů mezi celurosaury než k testování rozsahu Neornithes. Tomu napovídá i fakt, že klad (tinama + neognáti) neobdržel vůbec žádnou statistickou podporu.

*Příbuzenství litornise s tinamami je ale velice pochybné a oba taxony jsou dost možná spojeny výhradně pleziomorfickými znaky, které všichni ostatní paleognáti ztratili společně se schopností létat (šlo by pak o případ tzv. "přitahování krátkých větví", short-branch attraction). Na DML jsem o tom napsal zde.

1.5 Nezahrnuté a vyřazené taxony

    Autoři také komentují kritéria, na základě kterých se rozhodli některé taxony a priori vyřadit z analýzy nebo je v ní naopak ponechat. Scipionyx a "Raptorex" (ve skutečnosti nejspíš jen mládě tarbosaura – Fowler et al. 2011) byli vyřazeni, neboť jsou známi výhradně z materiálu patřícího mláďatům. Juravenator, který je na tom stejně, byl v analýze ponechán, protože jeho materiál je mimořádně kompletní a může být kódován na více znaků než kterýkoli jiný bazální celurosaur. A posteriori vyřazení juravenatora z analýzy alespoň ukázalo, že (ne)přítomnost tohoto taxonu nijak neovlivňuje topologii zbytku stromu. Řada jiných kompsognátidů (Compsognathus, Mirischia, Huaxiagnathus, Sinocalliopteryx) se do analýzy nakonec dostala taky, protože i přes všeobecné podezření na jejich nedospělost (pěkně shrnuté Mickey Mortimerovou) zatím nebyla publikována žádná histologická data, která by jejich juvenilní status definitivně potvrdila. Do analýzy se dostal i Epidendrosaurus – ač zastoupen jen nedospělým jedincem, reprezentuje unikátní, druhově chudou a málo známou skupinu celurosaurů. Množství chybějících dat ale z epidendrosaura činí "divokou kartu", která snižuje celkové rozlišení stromu, takže na finálním kladogramu tento taxon chybí. Jixiangornis, pokládaný občas za synonymum jeholornise, byl v analýze ponechán, což se ukázalo jako moudré rozhodnutí. Nejenže je tento pták podle výsledků analýzy blíže příbuzný pygostylianům (jichž je dokonce sesterskou skupinou) než jeholornisovi, ale krátce po publikaci studie Brusatteho a spol. vyšla studie, která přesvědčivě argumentuje pro jixiangornisovu validitu (Lefèvre et al. 2014). Na druhou stranu je zajímavé, že po vyřazení jixiangornise Sapeornis a Jeholornis spadnou do trichotomie s kladem Pygostylia, což je rozhodně přijatelnější než primární strom, na kterém je první taxon bazálnější než ten druhý.
    Působivé také je, že autoři vyřazují četné taxony, jejichž kódování nemohli osobně přezkoumat. Yixianosaurus se např. v nedávné době stal předmětem hned několika studií, které se neshodly na jeho fylogenetické pozici (Dececchi et al. 2012 – bazální maniraptor; Xu et al. 2013 – blíže neurčitelný deinonychosaur), Brusatte a spol. se ale nechtějí spoléhat na dříve publikované práce a taxon raději ze své analýzy vynechávají. Podobně je na tom i Xinjiangovenator, jehož pozice je rovněž extrémně nejistá a kterému se navíc zatím dostalo jen krátkého popisu (Rauhut & Xu 2005). Vynechán je překvapivě i obří opeřený tyrannosauroid Yutyrannus, který je znám z téměř kompletní kostry: ani zde totiž autoři nemohli přezkoumat materiál osobně a obrázky publikované v původním popisu nejsou dost detailní na to, aby z nich šlo kódování ověřit.
    Poněkud nešťastným se naopak jeví vynechání orkoraptora, dříve občas odkrývaného mezi kompsognátidy (např. Dal Sasso & Maganuco 2011). Brusatte a spol. to zdůvodňují tím, že Benson et al. (2009; na blogu viz zde) přesvědčivě zdokumentovali orkoraptorovu příslušnost k allosauroidnímu kladu Neovenatoridae. Problém je v tom, že allosauroidní pozice velké části neovenatoridů – té části, kterou Benson et al. (2009) nazvali Megaraptora a která zahrnuje i orkoraptora – je podle všeho založena na znacích, které v rámci Tetanurae vykazují širší výskyt a najdeme je i u tyrannosauroidů, čili celurosaurů. Novas et al. (2013) se rozhodli tuto hypotézu otestovat a zkombinovali relevantní znaky z analýzy Bensona a spol. se znaky z matice zaměřené na tyrannosauroidy. Zatímco Neovenator zůstal uvnitř allosauroidů a Chilantaisaurus se ukázal být divokou kartou přeskakující napříč celým kladem Tetanurae, skupina Megaraptora – a to včetně až dosud spolehlivě non-celurosauřího fukuiraptora – přeskočila do celurosaurů, a to konkrétně mezi bazální tyrannosauroidy, kde obsadila sesterskou pozici vůči kladu (Xiongguanlong + Tyrannosauridae). Stejný závěr podpořila i lehce upravená verze téže analýzy, obohacená o data získaná z nově objeveného nedospělého jedince megaraptora (Porfiri et al. 2014), kde mezi megaraptory vklouzl dokonce i tradiční tyrannosauroid Eotyrannus. Andrea Cau sice v Megamatrici tuto hypotézu neodhalil jako nejúspornější, rozdíl oproti optimálnímu stromku byl ale příliš malý, než aby ji šlo zamítnout. Na apriorní vyřazování megaraptorů z celurosauřích analýz je tedy možná příliš brzy.
    Hluboko v Supplemental Information konečně najdeme zasuté i některé velmi překvapivé novinky. Brusatte a spol. jako část svého projektu na rozšíření TWG matice osobně přezkoumali materiál taxonu Nedcolbertia, považovaného za jednoho z nejbazálnějších celurosaurů (Holtz & Osmólska 2004; Dal Sasso & Maganuco 2011) a dospěli k závěru, že není jasné, zda přiřazený materiál (náležející několika různým jedincům) patří ke stejnému taxonu jako holotyp. Bagaraatan je podle dosud nepublikovaných informací Petera Makovickyho chimérou složenou z materiálu tyrannosauroida a non-tyrannosauroidního celurosaura, což by vysvětlovalo, proč v předchozích analýzách vyšel jednou jako non-eumaniraptoří paravian (Rauhut & Xu 2005) a jindy jako tyrannosauroid (Carr & Williamson 2010). Pochybnostmi je konečně obklopen i nedávno popsaný a tolik medializovaný Zhuchengtyrannus. Ten by se svými 10 až 12 metry mohl společně s tyrannosaurem a tarbosaurem tvořit "velkou trojku" odvozených pozdněkřídových tyrannosauridů, podle Brusatteho a spol. ale není jisté, zda lze příslušný materiál od tarbosaura odlišit, na což ve svém článku upozornil Dan Madzia.

2. Časová kalibrace

    Jak už bylo řečeno, k provedení rozborů znakové evoluce je nejprve třeba strom zkalibrovat tak, aby byly délky větví vyjádřeny v absolutním čase (milionech let). Na stromě získaném pomocí maximální parsimonie jsou ale délky vyjádřeny v celkovém počtu změn (který je součinem trvání větve a rychlosti evoluce), a i tento počet parsimonie odhaduje zkresleně (nekoriguje ho o nepozorované znakové změny, čímž ho podhodnocuje).
    Brusatte et al. (2014) vycházejí z metody, kterou poprvé aplikovali na paleontologické stromy Ruta et al. (2006) a která předpokládá existenci morfologických hodin (Bapst 2014). Na rozdíl od bayesovských tip-dating metod popsaných v předchozím článku jde přitom o hodiny striktní, nikoli relaxované, takže rychlost morfologické evoluce je konstantní napříč celým stromem. Brusatte a spol. zde vycházejí ze stejné metodologie, kterou použili ve své nedávné studii o bahnících (Lloyd et al. 2012); poněkud ji ale upravují. Lloyd et al. (2012) využívali tři zdroje informací: počet znakových změn na každé větvi (odhadnutý pomocí rekonstrukce ancestrálních znakových stavů metodami ACCTRAN a DELTRAN), bodový odhad stáří pro každou špičku stromu (náhodně vytažený z uniformního rozdělení na příslušném časovém intervalu) a počet chybějících znaků pro každou špičku stromu. S pomocí posledního údaje dokázali zkorigovat o chybějící data větve vedoucí ke špičkám – tím, že odhadnutý počet změn vynásobili počtem známých znaků a vydělili celkovým počtem znaků –, ale ne už vnitřní větve, čili zbytek stromu. To je zjevně neuspokojivé: celý strom (včetně vnitřních větví) totiž odhadujeme jen z dat na špičkách, a obráceně by se proto i neúplnost dat měla promítat do celého stromu, a nikoli jen do jeho koncových větví.
    Aby se tomuto problému vyhnuli, Brusatte a spol. škálují strom ještě před tím, než odhadnou ancestrální stavy na jeho vnitřních uzlech. Musejí proto opustit morfologické hodiny (které závisejí na počtu znakových změn, který zase závisí na ancestrálních stavech) a přecházejí k jednodušší metodě, známé jako "equal" nebo "branch sharing" time-scaling. V prvním kroku analýzy je stáří každého kladu ztotožněno se stářím jeho nejstaršího zástupce. Tím ale vznikají větve s nulovou délkou – na každou bifurkaci dokonce připadá minimálně jedna, takže ve výsledku má nulovou délku nejméně jedna polovina všech větví na stromě. To je evidentně problematické: pokud na takové větvi došlo k jedné nebo více změnám, nulová délka implikuje nekonečně vysoké tempo evoluce. Aby se tomuto problému zamezilo, stáří kořene stromu se navýší o určitou arbitrární hodnotu a větvím s nulovou délkou se povolí sdílet sdílet dobu trvání s předcházející větví nenulové délky v takovém poměru, aby byla každá z výsledných větví stejně dlouhá. Na základě webových stránek Graeme'a Lloyda, autora této metody; slide'ů z Lloydovy přednášky; podrobné dokumentace k software'ovému balíčku paleotree od Davida Bapsta; a konečně Bapstovy prezentace z SVP 2012 jsem se pokusil nakreslit následující obrázek:

Metoda pro časové kalibrování (time-scaling) paleontologických stromů využitá ve studi Brusatteho a spol. (2014). Počáteční data se skládají z nedatované fylogeneze (1) a stratigrafického výskytu příslušných taxonů (2). Přesné stáří každého taxonu je náhodně vybráno z časových intervalů v bodě (2). V prvním kroku analýzy (3) jsou stáří zkombinována s topologií za zjednodušujícího předpokladu, že každý klad je právě tak starý, jako jeho nejstarší zástupce. Výsledkem jsou četné větve s nulovou délkou, které na obrázku vedou ke špičkám B, D, G a kladům (A+B+C) a (F+G). Ty jsou v následujícím kroku (4) odstraněny tím, že se kořen stromu posune o určitý časový interval (vyznačený šedě) do minulosti a větve s nulovou délkou se o čas rovnoměrně podělí s větvemi nenulové délky pod sebou (vyznačeno červeně a modře). Překresleno podle Lloyda (slide 15) a Bapsta (slides 43 a 45). (Zdroj: vlastní ilustrace)

    Na takto kalibrovaném stromě Brusatte a spol. odhadli ancestrální stavy metodou maximální věrohodnosti a spočetli počet znakových změn na každé větvi, přičemž brali v úvahu jen ty znaky, jejichž stav byl známý na obou koncích dané větve. Stejně jako Lloyd et al. (2012) pak použili počet známých znaků ke korekci odhadnutého počtu změn; tentokrát se ale tato korekce vztahuje na všechny větve včetně vnitřních. V této fázi tedy pro každou větev známe celkový počet změn $l$ a trvání v čase $t$, a můžeme proto spočítat rychlost $r$, se kterou se daná větev vyvíjela, jako $r = lt^{-1}$.

3. Analýzy tempa evoluce

    V dalším kroku autoři přistoupili k dvěma testům. První z nich měl odhalit, zda se určité větve vyvíjejí signifikantně rychleji či naopak pomaleji než zbytek stromu. Jak ukazují Lloyd et al. (2012), v této situaci chceme srovnat nulovou hypotézu, podle které je tempo evoluce na všech $k$ větvích stejné ($\lambda_1 = \lambda_2 = \dots = \lambda_k$), s alternativní hypotézou, podle které je tempo evoluce stejné pro všechny větve kromě $i$-té ($\lambda_i \neq \lambda_1 = \lambda_2 = \dots = \lambda_{i-1} = \lambda_{i+1} = \dots = \lambda_k$). Klíčovou statistikou je pak
\begin{equation}
D = - 2 \ln \left( \frac{L_1}{L_2} \right),
\end{equation}
kde $L_1$ je nejvyšší hodnota, které věrohodnostní funkce nabývá, pokud platí nulová hypotéza, a $L_2$ je absolutní maximum věrohodnostní funkce. V tomto konkrétním případě je tedy $L_1$ věrohodnost nejlepšího odhadu pro jediné tempo evoluce, které je podle nulové hypotézy společné všem větvím na stromě (získaného z dat na všech větvích), zatímco $L_2$ je věrohodnost nejlepšího odhadu pro tempo evoluce na $i$-té větvi (odhadnuté pouze z této větve samotné) a pro tempo evoluce společné pro všechny ostatní větve (odhadnuté z dat na všech větvích kromě $i$-té), ať už jsou tato dvě tempa stejná nebo ne.
    Druhý test se ptá, zda se ve srovnání se zbytkem stromu vyvíjí signifikantně rychleji či pomaleji určitý klad. Rychlost evoluce kladu $C$ se přitom spočte jako součet změn na všech větvích uvnitř tohoto kladu podělený celkovou dobou trvání těchto větví:
\begin{equation}
r_C = \frac{\sum\nolimits_i l_i}{\sum\nolimits_i t_i} \forall i \in C
\end{equation}
    Opět se využije test věrohodnostního poměru z rovnice (1). Čitatel ($L_1$) zůstává stejný, zatímco jmenovatel ($L_2$) se nyní rovná věrohodnosti nejlepšího odhadu pro tempo evoluce společné pro všechny větve uvnitř kladu $C$ a pro tempo evoluce společné všem větvím mimo klad $C$, ať už jsou tato dvě tempa stejná nebo ne.
    Všech 6 kenozoických taxonů přítomných v původním datasetu (žijící ptáci a Lithornis) bylo z datasetu vyřazeno, protože reprezentují pouze malý zlomek celkové diverzity post-mezozoických celurosaurů. Autoři také analýzy prováděli opakovaně na mnoha replikátech, aby se ujistili, že drobné změny v hodnotách klíčových údajů nemají vliv na hlavní výsledky. Jak bylo uvedeno výše, přesné stáří autoři tahali náhodně z uniformního rozdělení nad stratigrafickým rozsahem každého taxonu (který je jen vzácně znám s větší přesností než jako jeden celý stupeň, tj. interval o šířce několika milionů let). Jelikož doba trvání větve ovlivňuje jak věrohodnostní odhad ancestrálních stavů (a potažmo tedy i množství znakových změn $l$), tak i výpočet tempa evoluce v pozdější fázi analýzy, autoři tahání opakovali, dokud nezískali 100 různých replikátů. Nad každým z nich pak provedli dva výše popsané věrohodnostní testy. Počet replikátů byl omezený velikostí datasetu a náročností celého postupu: Lloyd et al. (2012) jich např. použili 1000.
    Brusatte a spol. dále použili celou řadu testů, aby překontrolovali validitu svých závěrů. První z nich už byl zmíněný výše: celá analýza byla zopakována na 9 dalších náhodně vybraných nejúspornějších stromech, z nichž pro každý bylo použito 25 replikátů a nad každým replikátem byly provedeny oba výše uvedené testy.
    Druhý test se zaměřoval na nejistotu ohledně doby trvání větví: autoři pomocí balíčku paleotree (Bapst 2012) překalibrovali strom metodou minimální délky (minimum branch length). Ta větve s nulovou délkou odstraňuje prostým přičtením určité arbitrárně zvolené hodnoty, přičemž čas přidaný k pozdějším větvím je odečten z větví předcházejících (viz opět zde). Brusatte et al. (2014) stanovili minimální povolenou délku větve na 1 milion let a kalibrovali tímto způsobem stejný nejúspornější strom, který byl použit pro primární analýzu, se 100 replikáty lišícími se v přesné dataci špiček.
    Třetí analýza nastavila všem větvím stejnou ("jednotkovou") délku, čímž se rychlost evoluce stala přímo úměrnou počtu znakových změn a zcela nezávislou na čase. I zde byl použit stromek z primární analýzy se 100 datačními replikáty.
    Ve čtvrtém rozboru byly ze stromu náhodně odstraňovány taxony tak, aby byla každá z 9 hlavních linií (Tyrannosauroidea, Compsognathidae, Ornithomimosauria, Therizinosauria, Alvarezsauroidea, Oviraptorosauria, Dromeosauridae, Troodontidae, Avialae) zastoupena pouhými 6 špičkami. (Tento počet byl přizpůsoben velikosti nejmenšího taxonu, kterým jsou kompsognátidi.) Celkem takto bylo ořezáno 1000 různých stromů – každému z nich byla náhodně přidělena stáří špiček a jedna z deseti topologií, se kterými pracovaly předchozí testy. V tomto místě jsou překvapivě citováni Fitch & Bruschi (1987) – molekulárněfylogenetická studie o bakteriích, která zdůraznila (již tehdy dobře známý) fakt, že počet znakových změn na určité větvi koreluje s počtem uzlů, které na této větvi leží. Druhově chudé větve, které prodělaly jen málo štěpení, tak zdánlivě vykazují nízkou rychlost znakové evoluce. Prostříhané stromy mají tento efekt eliminovat.
    Konečně pátý test měl za úkol odhalit potenciální rozdíly v rychlostech evoluce mezi koncovými a vnitřními větvemi a případně eliminovat jejich vliv na analýzu. Celkový počet znakových změn by totiž mohl být podhodnocen tím, že úspornostní fylogenetické analýzy obvykle nesamplují znaky, které jsou unikátní pro jednu špičku z celého stromu (= autapomorfie). Autoři proto modifikovali oba věrohodnostní testy popsané výše: každou vnitřní větev porovnali jen se všemi ostatními vnitřními větvemi, každou koncovou větev se všemi ostatními koncovými větvemi, vnitřní větve uvnitř určitého kladu s vnitřními větvemi mimo tento klad, a koncové větve daného kladu s ostatními koncovými větvemi. Použito opět bylo 10 topologií, každá po 25 replikátech.

Konsenzus nejúspornějších stromů (většina maniraptořích kladů je pro přehlednost zkolabována) s vyznačenými rychlostmi morfologické evoluce. Výsečové grafy na jednotlivých větvích ukazují, v kolika ze 100 replikátů beroucích v úvahu nejistou dataci se dané větve vyvíjejí signifikantně odlišnou rychlostí oproti zbytku stromu. Červeně jsou vyznačeny signifikantně rychlé větve, modře signifikantně pomalé větve a bíle non-signifikantní větve. Velké výsečové grafy stejným způsobem ilustrují, zda se ve srovnání se zbytkem stromu vyvíjejí odlišně některé z devíti hlavních celurosauřích podskupin. Siluety ilustrující jednotlivé klady pocházejí z webové stránky PhyloPic, projektu Mike'a Keeseyho poskytujícího Public Domain a Creative Commons ilustrace žijících i vymřelých organizmů. (Modifikováno z Brusatte et al. 2014: Figures 1 a 2)

4. Rychlosti evoluce

    Analýza odhaluje signifikantně zvýšené rychlosti evoluce u ptáků (avial) a do menší míry i u tyrannosauroidů. V obou případech je tento výsledek robustní vůči použité topologii a metodě časové kalibrace. Trochu problematické je, že je robustní i vůči třetímu testu (s větvemi jednotkové délky), což naopak naznačuje, že by mohlo jít o artefakt nerovnoměrného znakového samplingu. (Rychlejší evoluci vidíme, protože se mění víc znaků, víc znaků se mění, protože jsme jich víc zahrnuli do analýzy.) Brusatte et al. (2014) konstatují, že právě tato příčina zřejmě stojí za zdánlivou zrychlenou evolucí tyrannosauroidů – TWG matice totiž povyrostla na 853 znaků z velké části díky tomu, že ji autoři zkombinovali s relativně velkou (více než 200 znaků) datovou maticí zaměřenou speciálně na tyrannosauroidy. V případě avial jsou Brusatte a spol. klidnější: sampling TWG matice je sice jednoznačně zkreslený ve prospěch paravianů, nedá se ale říct, že by některému ze tří hlavních paravianních kladů (Dromaeosauridae, Troodontidae, Avialae) ve srovnání s ostatními nadržoval. Je sice pravda, že stejným způsobem, jakým byla nyní do TWG vhozena tyrannosauroidní matice, do ní už dříve Turner et al. (2012) začlenili ptačí matici od Clarke et al. (2006), tehdy však šlo spíše o nápravu předchozího undersamplingu.
    O tom, že zrychlená evoluce avial je skutečný signál a zrychlená evoluce tyrannosauroidů pouhý artefakt, svědčí i některé z výše popsaných testů. Některé replikáty primární analýzy (s odlišnými délkami větví) zvýšené tempo evoluce u tyrannosauroidů neodhalily, a někdy dokonce zaznamenaly opačný výsledek (signifikantní zpomalení). Zatímco ptákům vysoké rychlosti evoluce při taxonomickém subsamplingu (redukce všech skupin na 6 špiček) sice poklesly, ale zůstaly; tyrannosauroidi přecházejí do druhého extrému a stávají se nejvýznamněji "pomalým" kladem, který dokonce neobsahuje vůbec žádné "rychlé" větve. Oddělená analýza vnitřních a koncových větví přináší rozporuplné výsledky: tyrannosauroidi vykazují signifikantně zvýšenou rychlost evoluce, dokud se díváme na vnitřní větve, ale při analýze koncových větví přestává být jejich odlišnost signifikantní. Zdá se tedy, že ptáci zaujímají v celurosauří evoluci výjimečné postavení. To potvrzuje i skutečnost, že zvýšenou rychlost evoluce vykazuje i celá linie, která spojuje ptáky s bází maniraptoriformů, zatímco žádný z "vedlejších" kladů, které se z ní odštěpují, signifikantně zrychlený není. Částečnou výjimkou je jen skupina Microraptoria, která ale chybí na striktním konsenzu nejúspornějších stromů, a pochybný klad (Anchiornis + Aurornis + Eosinopteryx + Xiaotingia).

Modely znakové evoluce: horizontální osa reprezentuje čas, vertikální osa morfologickou variabilitu. Odshora dolů: "early burst" model (zpomalující evoluce), Ornstein-Uhlenbeckův proces, "late burst" model (akcelerující evoluce). (Zdroj: anoleannals.org, kredit: Travis Ingram)

    Brusatte a spol. konstatují, že jejich studie podporuje "early burst" model, podle kterého evoluce znaků v určitém kladu probíhá nejrychleji krátce po jeho vzniku a postupně se zpomaluje s tím, jak se zaplňují ekologické niky (viz např. Slater & Pennell 2013). Uvádějí také, že zatímco jiné nedávné velkoškálové studie odkryly buď pozvolné trendy začínající dlouho před vznikem ptáků, nebo významné inovace uvnitř ptáků samotných, v jejich studii je významné zvýšení tempa evoluce lokalizováno přesně u ptačího původu (dochází k němu na větvi pod uzlem Avialae). Tímto výrokem se vracejí ke kontroverzi, která se vynořila ve velkoškálových studiích dinosauří evoluce posledních několika let: byli to skutečně ptáci (ve smyslu avial), kteří se v něčem signifikantně odlišovali od ostatních dinosaurů, nebo ke vzniku klíčových evolučních novinek došlo už dříve (či naopak později)? Shodou okolností se přitom právě letos objevila celá lavina studií, které tuto otázku adresovaly, a většina z nich je se závěry Brusatteho a spol. v rozporu.
    Puttick et al. (2014) např. explicitně zdůraznili, že "Paraves, rather than Aves alone, shifted to a different evolutionary model relative to other coelurosaurian theropods" (Puttick et al. 2014: 1503). Zatímco na větvi přímo pod Paraves došlo ke zrychlení evoluce tělesných rozměrů a relativní délky předních končetin, autoři našli "little evidence for elevated rates leading to or within Aves" (Puttick et al. 2014: 1505).* Benson et al. (2014) o několik měsíců později identifikovali na dinosauřím stromě celkem 23 míst, kde došlo mimořádným změnám tělesných rozměrů. Jejich distribuce naznačuje "early burst" během triasových počátků dinosauří radiace, po kterém rychlosti evoluce začaly klesat, a to s jedinou výjimkou, kterou opět představovala ptačí kmenová linie (a především maniraptoři). Jedině větev táhnoucí se k moderním ptákům si dokázala udržet vysoké tempo evoluce a soustavně produkovat další a další ekologické inovace po celých 170 milionů let od vzniku dinosaurů po katastrofu na přelomu K/Pg – a, jak ukázali např. Jetz et al. (2012), vlastně i po ní. Ani Benson et al. (2014) ale nezaznamenali, že by vznik ptáků samotných představoval nějakou mimořádnou událost – ke skokovým změnám tělesných rozměrů došlo buď už předtím (např. u báze kladů Maniraptora a Pennaraptora), nebo až potom (Ornithuromorpha). Konečně Lee et al. (2014) zaznamenali zvýšené rychlosti evoluce na celém dlouhém úseku ptačí kmenové linie (od vzniku Neotetanurae po vznik Paraves) a konstatovali, že "[t]he branch leading to “birds” (Avialae, Aves sensu lato) does not undergo exceptional amounts of evolution" (Lee et al. 2014: Supplementary Materials: 13).

*S velmi podobným, ale paradoxně opačným závěrem přišli o rok dříve i Benson & Choiniere (2013), podle kterých kdesi v blízkém okolí vzniku ptáků prudce vzrostla disparita zadních končetin, což vedlo k "increased diversification rates, unparalleled in magnitude at any other time in the first 155 Myr of theropod evolution". Jejich pokus lokalizovat tuto událost nějak přesněji ale odhalil, že "the most likely node for this rate shift is Pygostylia" – k zásadnímu posunu nemělo dojít těsně před vznikem ptáků, nýbrž až těsně po něm. Puttick et al. (2014) považovali tento rozdíl oproti vlastním výsledkům za důsledek odlišné metodologie, která na rozdíl od jejich programu MEDUSA (viz krátce zde) nedokázala identifikovat změny v rychlosti evoluce specifické pro konkrétní větev.

5. Morfologická odlišnost

    Brusatte a spol. naopak neodhalili žádnou morfologickou propast, která by ptáky odlišovala od ostatních teropodů. K otestování relativní odlišnosti ptáků od ostatních celurosaurů autoři zkonstruovali morfoprostor z datové matice své fylogenetické analýzy, kterou pro tyto účely považují za ideální. Dělením znaků do několika málo diskrétních stavů se sice ztrácí informace, z praktického hlediska je však takový přístup při zacházení s fragmentárními fosiliemi často užitečnější než morfometrie poskytující spojitá data. Problémem by neměla být ani nepřítomnost autapomorfií, typická pro všechny datasety šité na míru metodě maximální parsimonie. (I zde je výjimkou Megamatrice – viz komentáře Andrey Cau'a na toto téma na TetZoo.) Podle autorů by problematické bylo naopak jejich zahrnutí, které by mohlo uměle zvyšovat relativní odlišnost nedávno popsaných a/nebo lépe studovaných taxonů. Datová matice byla transformována na matici párových euklidovských vzdáleností, kterou autoři podrobili vícerozměrnému škálování metodou hlavních koordinát. To snížilo dimenzionalitu dat na 145 os, z nichž bylo pro další analýzu použito 125 těch, které dohromady zachycují 90% celkové variability.

Celurosauří morfoprostor. Analýza metodou hlavních koordinát rozprostřela celkovou variabilitu na 145 os, z nichž každá vysvětluje výše celkové variability než ta následující. Pro hlavní analýzy autoři využili 125 os, v grafech výše jsou zobrazené první 3 osy, které vysvětlují nejvíc variability (dohromady 4,25%). V prvním grafu je zanesena osa 2 (1,48% variability) vůči ose 1 (1,57%); v druhém grafu je zanesena osa 3 (1,19%) proti ose 2. Barevné značení je názorně vysvětleno výše (viz také předchozí obrázek). Ptáci (tmavě fialová) se zřetelně odlišují od ostatních celurosaurů podél osy 1, ale podél žádné jiné osy už nikoli, a celkově jsou tak v rámci celurosaurů morfologicky poměrně nevýrazní. (Modifikováno z Brusatte et al. 2014: Figure 3)

    Permutační testy neprokázaly, že by avialy v morfoprostoru zaujímaly signifikantně odlišnou pozici než ostatní celurosauři. Tento závěr byl přitom nezávislý na tom, zda bylo s ostatními podskupinami celurosaurů kontrastováno jen 22 druhohorních ptáků, nebo se k nim přidalo i 6 post-mezozoických taxonů; s výsledkem nepohnulo ani zahrnutí čtveřice (Anchiornis, Aurornis, Eosinopteryx, Xiaotingia) do avial místo troodontidů. Obecně se zdá, že jednotlivé podskupiny celurosaurů jsou od sebe v morfoprostoru statisticky nerozeznatelné. Analýza ale odhalila signifikantní rozdíly mezi oviraptorosaury a deinonychosaury, mezi oviraptorosaury a terizinosaury, a mezi tyrannosauroidy a ornitomimosaury, což znamená, že tyto dvojice taxonů jsou si navzájem nepodobnější více, než ptáci a jejich nejbližší příbuzní. Podle autorů tento fakt vysvětluje, proč mají ve fylogenetických analýzách taxony jako Anchiornis nebo Archaeopteryx (a jejich příklady bychom mohli rozšířit o xiaotingii, balaura, rahonavise, mikroraptoriany a unenlagiiny) sklon přeskakovat mezi deinonychosaury a avialami.
    Autoři dále porovnali euklidovské vzdálenosti mezi 22 ptáky a 21 dromeosauridy (celkem 462 párových vzdáleností) a stejnými 22 ptáky a 16 troodontidy (352 vzdáleností) s kontrolní skupinou, sestávající z 2534 párů celurosaurů, kde oba členové páru patřili do jiné z osmi hlavních neptačích celurosauřích podskupin (viz výše). V další analýze byly euklidovské vzdálenosti mezi 22 ptáky a 37 deinonychosaury (814 vzdáleností) porovnány s kontrolní skupinou sestávající z 2198 párů ostatních celurosaurů. Cílem bylo ukázat, zda se ptáci od svých nejbližších příbuzných v průměru odlišují víc, než se od svých nejbližších příbuzných odlišují jiné celurosauří skupiny. Rozdíly zde sice existovaly a díky značné velikosti vzorku byly statisticky významné, v praxi ale byly zanedbatelné (rozdíly středních hodnot kolísaly mezi 0,8% a 1,3%.). Navíc se ukázalo, že druhohorní ptáci nezabírají více morfoprostoru než ostatní skupiny celurosaurů, a to hned podle čtyř různých měřítek. U některých vzdálenějších kladů sice jedno nebo dvě měřítka odhalila statisticky signifikantní rozdíl oproti ptákům, nikdy ale nebyl zaznamenán významný rozdíl mezi morfoprostorem zabíraným ptáky a morfoprostorem zabíraným jejich nejbližšími příbuznými, jako jsou dromeosauridi, troodontidi a oviraptorosauři.

6. Implikace pro ptačí evoluci

    Na základě těchto zjištění Brusatte a spol. konstatují, že navzdory prudkému zvýšení rychlosti evoluce u báze avial neexistuje mezi ptáky a ostatními celurosaury prakticky žádná morfologická mezera, a druhohorního přírodovědce by zřejmě nenapadlo rozlišovat mezi zvířaty typu velociraptora a zvířaty typu archeopteryga. Obrovský evoluční úspěch ptáků zřejmě nebyl důsledkem jediné klíčové adaptace, ale pozvolné akumulace řady odlišných znaků, které dnes tak zřetelně odlišují ptáky od ostatních obratlovců. Teprve tehdy, když se nashromáždily všechny a jako díly skládačky zapadly na své místo v rámci toho, čemu dnes říkáme ptačí tělní plán, se ptákům otevřela cesta k rapidní diverzifikaci a expanzi mimo svůj doposud nevýrazně vymezený morfoprostor.
    Brusatte a spol. uzavírají svou práci konstatováním, že ačkoli se jednotlivé studie neshodnou na tom, kde přesně na fylogenetickém stromě došlo k prudkému zvýšení tempa evoluce, existuje velmi silná evidence, že k takové události v těsné blízkosti vzniku ptáků skutečně došlo. Přechod mezi dinosaury a ptáky představoval zcela unikátní fázi dinosauří evoluce, během které došlo v rychlém sledu k zásadním změnám v evoluci tělesných rozměrů, délky předních končetin a celé řady diskrétních morfologických znaků. Jde tedy o podporu jak "early burst" modelu znakové evoluce, tak i staré teorie adaptivních radiací G. G. Simpsona. Podle autorů jsou zvýšené rychlosti morfologické evoluce charakteristickým doprovodem pro vznik nového tělního plánu, a nezáleží přitom na to, zda byl tento plán získán náhle nebo – jako u ptáků – postupným skládáním celé řady klíčových inovací.

7. Ksepka (2014)

    Current Biology vedle studie Brusatteho a spol. otiskla i doprovodnou práci Daniela Ksepky, známého především svým výzkumem fosilních tučňáků (na blogu viz např. zde). Ksepka (2014) nejprve ukazuje, jak se nejnovější studie nedokážou shodnout na fylogenetických pozicích taxonů Anchiornis, Archaeopteryx, Aurornis nebo Xiaotingia, se zvláštní zmínkou balaura a rahonavise, kteří – navzdory své dosavadní zdánlivé neproblematičnosti – začali mezi ptáky a jejich nejbližšími příbuznými přeskakovat také. Autor také shrnuje výsledky Putticka a spol. (2014), Bensona a spol. (2014) a Leeho a spol. (2014), přičemž jeho interpretace je podobná té, kterou v primární studii nabízejí Brusatte s kolektivem. I když se tyto práce liší ve svém určení přesného místa, kde se evoluce tělesných rozměrů výrazně urychlila, všechny se shodují na tom, že ptáci stojí na konci dlouhodobé miniaturizace, která vyvrcholila proražením dosavadní spodní velikostní hranice 1 kilogramu, umožňujícím vznik aktivního letu. Co je nejdůležitější, tato výjimečná linie teropodů dokázala navázat na svůj druhohorní úspěch i po katastrofickém vymírání na přelomu K/Pg, a dala tak vzniknout skupině zvířat s ohromující rozmanitostí, bez které si dnešní ekosystémy nedovedeme představit: žijícím ptákům.

Zdroje:

Paleontologie a bayesovské datování, díl 1. – fosilie jako kalibrace vs. fosilie jako špičky stromu

    Poslední příspěvky na blogu se věnovaly bayesovskému molekulárnímu datování: problémům s ním spojeným, výsledkům, které podává v případě ptačí evoluce, a kontroverzím, které tyto výsledky vyvolávají. Možná by proto stálo za to podívat se i na jeho metodologickou stránku, a to se zvláštním ohledem na nový slibný postup, který zapojuje fosilie do datování daleko důkladněji, než tomu bylo dříve. Skvělou příležitost k tomu nabízejí dvě letošní studie, které tuto novou metodu aplikují na neptačí dinosaury a které budou předmětem následujících dílů této série.

1. Bayesovské datování

    Většina parametrických fylogenetických analýz odhaduje nejen topologii a parametry evolučního modelu, ale také délky větví. Délka je definována jako součin stáří větve a rychlosti, s níž se větev vyvíjí: $l = \mu \times t$. Tradiční modely předpokládají, že délky větví jsou nezávislé a identicky distribuované. To je jednak z biologického hlediska těžko ospravedlnitelné (očekávali bychom, že délky dceřiných větví budou aspoň nějak souviset s délkou větve mateřské), jednak to neumožňuje odhadovat ani rychlost evoluce, ani data divergencí – zjistit můžeme jen jejich součin, ve kterém nelze relativní příspěvky stáří a rychlosti nijak oddělit od sebe (Drummond et al. 2006). Analýzy tohoto typu bývají někdy označovány jako "bezčasové" (time-free) (Wertheim et al. 2010). Důvodem, proč byl tento nerealistický přístup tak dlouho tolerován, je fakt, že jedinou alternativu dlouho představoval ještě horší model molekulárních hodin, který předpokládá, že rychlost evoluce je u všech vývojových linií konstantní. Přijmeme-li tento předpoklad, datování divergencí se stává nejen možným, ale přímo triviálním. Při konstantní rychlosti evoluce je totiž délka každé větve je přímo úměrná jejímu stáří, a stačí tedy zjistit koeficient úměrnosti pomocí nějaké fosilní kalibrace – pak už lze očekávané počty substitucí přímo přepočítat na miliony let. Právě tak postupovali v 80. a 90. letech v ptačí fylogenetice Sibley a Ahlquist, už tehdy však začínalo být jasné, že předpoklad globálních hodin je neudržitelný.
    Prostřední pozici mezi oběma extrémy, tj. předpokladem totální nezávislosti délek větví na jedné straně a striktními molekulárními hodinami na straně druhé, se podařilo najít až na konci 90. let v tzv. relaxovaných hodinách (relaxed-clock models). Spolu s tím se otevřel prostor pro robustnější datovací metody. Většina datovacích analýz využívajících relaxované hodiny je prováděna v bayesovském frameworku a zahrnuje tři klíčové složky (podseznamy nejsou zamýšleny jako vyčerpávající):
  1. parametrické apriorní rozdělení (model*) rychlostí evoluce, které může mít několik různých forem (viz Brown & van Tuinen 2011; Heath & Moore 2014):
    • lokální molekulární hodiny
    • autokorelované rychlosti
    • exponenciálně distribuované nekorelované rychlosti
    • lognormálně distribuované nekorelované rychlosti
    • směsi rychlostí
  2. parametrické apriorní rozdělení pro topologie a zároveň stáří jejich uzlů ("tree prior", přesněji time-tree prior nebo tree process prior [Heled & Drummond 2013], česky snad "model speciace"):
    • Yuleův proces (čisté množení; pure birth)
    • proces množení a zániku (birth-death process)
    • koalescenční proces
  3. parametrická kalibrační hustota pravděpodobnosti ("calibration prior", přesněji calibration density – viz Heled & Drummond 2012):
    • uniformní
    • normální (Gaussova)
    • exponenciální
    • lognormální

V bezčasové analýze (vlevo) je délka každé větvě úměrná součinu jejího tempa evoluce a trvání v čase. Relaxované hodiny umožňují oba činitele oddělit a odhadovat rychlost evoluce (uprostřed) i stáří uzlů (vpravo) zvlášť. Přepočítat stáří uzlů na absolutní čas umožňují fosilní kalibrace, znázorněné červenými trojúhelníky. (Zdroj: treethinkers.org, kredit: Tracy Heath)

    K analýze je možné přidávat i další prvky (lze si např. vynutit monofylii některých uzlů), tyto tři jsou však nutným základem. Abychom odlišili, jak se na celkovém množství změn (= délce větve) podílí rychlost a jak čas, musíme učinit určité předpoklady o tom, jak se rychlost evoluce mění napříč stromem (1). Pokud tento model rychlostí (1) zkombinujeme s modelem pro časy uzlů (2), znovu se dostáváme tam, kde jsme byli u striktních molekulárních hodin. Délka větve je přímo úměrná jejímu stáří, a jde tedy o odhad relativního času divergence. Konstantu úměrnosti, která relativní stáří převede na stáří absolutní, dodá jedna nebo více fosilních kalibrací (3). Přesný tvar každého z těchto tří apriorních rozdělení popisují hyperparametry**. Jedna sada hyperparametrů určuje např. tvar rozdělení, ze kterého taháme rychlosti pro jednotlivé větve stromu (1). Další potřebujeme pro model speciace (2): Yuleův proces je popsán jedním hyperparametrem, proces množení a zániku dvěma. Konečně i tvar kalibračních hustot (3) je nutné stanovit touto formou. Provádíme-li sdružený odhad topologie a stáří jejich uzlů, jak je běžné v dnešních analýzách, lze podle Bayesovy věty celý proces zapsat jako

\begin{equation}
f\left( \tau, t, r, \Theta, \Phi, \Omega \,\middle\vert\, \boldsymbol{X} \right) = \frac{f(\tau \,\vert\, \Theta) f(t \,\vert\, \Theta) f(r \,\vert\, \Phi) f(\Theta) f(\Phi) f(\Omega) f(\boldsymbol{X} \,\vert\, \tau, t, r, \Omega)}{f(\boldsymbol{X})} \\
\end{equation}
kde $\tau$ je topologie fylogenetického stromu, $t$ je vektor (uspořádaná n-tice náhodných veličin) stáří uzlů, $r$ je vektor rychlostí evoluce, $\Theta$ je vektor obsahující hyperparametry modelu speciace, $\Phi$ je vektor obsahující hyperparametry modelu rychlosti evoluce, $\Omega$ je vektor obsahující parametry modelu molekulární evoluce a $\boldsymbol{X}$ jsou sekvenční data. (Podle Drummond et al. 2006, Heath & Moore 2014.)

*Ačkoli v bayesovské inferenci "apriorní pravděpodobnost" a "model" neznamenají totéž (apriorní pravděpodobnost je na modelu závislá: $\mathrm{Pr}(\theta) = \mathrm{Pr}(\theta \,\vert\, M)$), v tomto kontextu jsou oba pojmy používány jako vzájemně zaměnitelné – např. "birth-death prior" a "birth-death model".

**Apriorní rozdělení popisuje pravděpodobnost, jakou různým hodnotám parametru přiřazujeme předtím, než provedeme analýzu dat. Parametry, které popisují tvar apriorního rozdělení, jsou označovány jako hyperparametry, a apriorní rozdělení hyperparametrů se nazývá "hyperprior" (viz níže).

    Z rovnice (1) je patrné, že zatímco pro model rychlostí i model speciace jsou hyperparametry odhadovány (analýza hledá jejich aposteriorní rozdělení), v případě kalibračních hustot tomu tak není. Jejich tvar musí být nastaven ještě před analýzou, a právě z této skutečnosti vyplývá celá řada problémů.

2. Kalibrační hustoty

    Samo konstruování kalibračních hustot je přitom relativní novinkou. Ve starších datovacích analýzách bývalo stáří kalibrační fosilie přímo ztotožňováno se stářím divergence, což je zjevně neuspokojivé – kalibrační fosilie využívaná ke kalibraci je produktem divergence, kterou má datovat. Musí tedy být zákonitě o něco mladší, dokonce o tolik mladší, aby už disponovala morfologickými znaky charakteristickými pro jednu stranu této divergence. Skutečné stáří uzlu bude nejspíš o několik milionů let vyšší, než je stáří kalibrační fosilie, a díky neúplnosti fosilního záznamu vždy existuje i malá (ale nenulová) pravděpodobnost, že tento rozdíl bude ještě podstatně větší. Fosilní záznam tedy striktně vzato dovoluje pouze stanovení dolních hranic, čili minimálního stáří divergence. Máme-li fosilii 1, starou 50 milionů let, která spadá do kmenové linie taxonu A, víme, že divergence mezi A a jeho nejbližším žijícím příbuzným B musí být starší než 50 milionů let: stáří fosilie představuje tvrdou dolní hranici (hard lower bound) pro stáří divergence. Z principu ale nemůže existovat fosilie, jejíž stáří by nutně muselo být vyšší než stáří divergence. Pokud bychom např. objevili 60 milionů let starou fosilii 2, která by spadala do kmenové linie celého kladu A+B, pořád to neznamená, že divergence mezi A a B nemůže být stará např. 90 milionů let:

Fosilie z kmenové linie taxonu A (1) představuje tvrdou dolní hranici pro stáří společného předka A a B. Naproti tomu fosilie z kmenové linie celé skupiny A+B (2) neříká o stáří této skupiny nic a neumožňuje jej omezit shora: oba datované stromy jsou s pozicí a stářím fosilie 2 stejně kompatibilní. (Zdroj: vlastní ilustrace)

    Z řad paleontologů přesto zaznívají argumenty, že někdy horní hranice stanovit lze. Příkladem může být situace, kdy má korunní klad celou řadou vymřelých příbuzných, jejichž stáří přibližně koresponduje s fylogenetickou pozicí (tj. čím bazálnější, tím starší):

Máme-li fosilií z kmenové linie kladu A+B více, věci jsou komplikovanější. Stáří fosilií 2, 3, 4 a 5 koreluje s jejich fylogenetickou pozicí. Na rozdíl od dolního stromu nám strom nahoře nedává žádný důvod takovou shodu očekávat, a proto je dolní strom lepším vysvětlením pozorovaných dat. V datovací analýze bychom to měli vzít v úvahu a stanovit horní hranici pro stáří kladu A+B, která odpovídá stáří fosilie 2. (Zdroj: vlastní ilustrace)

    Obdobně by šlo argumentovat, že někdy je fosilní záznam natolik kompletní, že pokud v určitém období nějakou skupinu nenalézáme, jde o dostatečně silný důkaz, že ještě neexistovala. Tento argument je často zmiňován v kontroverzi o stáří moderních ptáků – z rané křídy, do které umisťují původ neornitů některé molekulárnědatovací studie, známe několik lokalit s velmi bohatou avifaunou (Yixian, Jiufotang), ve které ale není po moderních ptácích ani stopy. Marjanović & Laurin (2007) argumentovali, že pokud datovací analýza zahrnuje horní hranice, výsledné odhady jsou realističtější, zatímco výhradní užívání dolních hranic má tendenci stáří uzlů podhodnocovat.
    Ačkoli tedy maxima mohou být užitečná, zůstává otázkou, jak je implementovat. Tvrdé horní hranice (hard upper bounds), analogické tvrdým dolním hranicím popsaným výše, jsou problematické hned z několika důvodů. Tím nejpodstatnějším je zřejmě fakt, že nemohou být "přehlasovány" žádným množstvím dat. Pokud se výše nastíněné úvahy o kompletnosti fosilního záznamu někde seknou a pravé datum divergence bude starší než tvrdé maximum, analýza jej nikdy neodhalí. Existuje ale i opačný problém: pokud budeme příliš opatrní a tvrdou dolní hranici posuneme příliš daleko do minulosti ve snaze vyhnout se předchozímu problému a nezamítat a priori ani málo pravděpodobná vysoká stáří, odhady budou vycházet nerealisticky staré (Yang & Rannala 2006).
    Bayesovský přístup k fosilním kalibracím umožňuje tyto problémy elegantně obejít – nikoli však proto, že by šlo o naprostý převrat, jako spíš tím, že šikovně zobecňuje dřívější praxi. Autoři prosazující používání tvrdých maxim stanovili tvrdou dolní i horní hranici a výsledný odhad nechali spadnout kamkoli mezi ně čistě podle toho, co říkají data. Z bayesovského hlediska bychom to mohli vnímat tak, že (implicitně) stanovili uniformní apriorní rozdělení pro interval $(\min, \max)$. Není však důvod, proč by rozdělení muselo být uniformní. Naopak, výše uvedená fakta ukazují, že ideální by bylo zkonstruovat takové apriorní rozdělení, které nejvyšší pravděpodobnost přiřadí datům o pár milionů let starším, než je stáří kalibrační fosilie, a do hlubší minulosti nechá vyčnívat dlouhý "ocásek" nízké (ale ne nulové) pravděpodobnosti. Existují rozdělení, jejichž tvar přesně takovým požadavkům odpovídá – např. exponenciální nebo lognormální.

Různé kalibrační hustoty a hyperparametry, které určují jejich tvar, na obrázku z přednášky The Fossilized Birth-Death Process od Tracy Heathové. Uniformní rozdělení je určeno dolní a horní hranicí, lognormální rozdělení střední hodnotou a směrodatnou odchylkou, gama rozdělení tvarem a rozsahem, exponenciální rozdělení lambdou. (Zdroj: slideshare.net/trayc7, kredit: Tracy Heath)

    Začlenit do tohoto frameworku horní hranice je již jednoduché: stačí si pohrát s hyperparametry (udávajícími přesný průběh funkce apriorní hustoty pravděpodobnosti) tak, aby se přesně specifikovaná část apriorní pravděpodobnosti (spočtené jako integrál z hustoty) – např. 95% nebo 97,5% – soustředila v intervalu mezi minimem a maximem. Vzhledem k tomu, že malá část pravděpodobnosti zůstává vyhrazena pro odhady starší než maximum, je takto stanovená horní hranice "měkká" (soft upper bound) (Yang & Rannala 2006). Díky populárním softwarovým balíčkům MCMCtree a především BEAST apriorní hustoty a měkké horní hranice rychle nahradily dřívější metody, a to i v ptačí fylogenetice (např. Brown et al. 2008).

3. Problémy s kalibracemi...

    Brzy se ale i tento postup ukázal být problematickým. Hlavní problém asi nejlépe popsal Joseph Brown:
However, the same flexibility that makes these distributions so attractive unfortunately also makes them inherently subjective. Although rightly considered with enthusiasm [...], there is presently no rigorous protocol for determining the optimal shape [...] and breadth of these distributions, which makes direct comparisons across studies difficult.
Brown & van Tuinen 2011: 318
Nevertheless, at the moment construction of lognormal (and other) constraints is more of an art than a science; scientists would do best to investigate the sensitivity of divergence time inferences to changes in temporal prior constraints.
Brown & van Tuinen 2011: 319
    První studie popisující citlivost výsledných odhadů na tvar kalibračních hustot se začaly objevovat několik let zpátky a jejich výsledky byly všechno, jen ne povzbudivé. Clarke et al. (2011) a Warnock et al. (2012) ukázali, že i zdánlivě nevinná změna hodnot hyperparametrů – např. střední hodnoty ($\mu$) a směrodatné odchylky ($\sigma$) lognormálního rozdělení – může střední odhad stáří posunout až o několik stovek milionů let. To ukazuje, že – jak konstatují Heath & Moore (2014: 312) – kalibrační hustoty se chovají spíše jako "pseudodata" než jako klasické apriorní pravděpodobnosti, které jsou aktualizovány analyzovanými daty. Aposteriorní rozdělení časů divergence je vysoce citlivé na výběr a konkrétní nastavení kalibračních hustot a zpravidla jej těsně kopíruje.

Citlivost aposteriorních odhadů stáří na volbu hyperparametrů kalibrační hustoty. První dvě analýzy (1042 Ma BasalMax a 509 Ma BasalMax) využívají uniformní hustoty s různými maximy. Stanovení mladšího maxima snížilo stáří kořene stromu o více než 150 milionů let. Zbylé čtyři analýzy používají oříznuté Cauchyho rozdělení (truncated Cauchy distribution), které je výchozí volbou v programu MCMCtree. Autoři nastavili hyperparametr umístění (nejvyšší hodnotu rozdělení) tak, aby příslušné datum odpovídalo 110%, 125%, 150% a 175% stáří dolní hranice. Předěly mezi dvěma odstíny spojují navzájem si odpovídající uzly. (Zdroj: Clarke et al. 2011: Figure 8)

    Výhrady navíc přicházely i z jiných stran. Heled & Drummond (2012) upozornili, že kalibrační hustota, kterou uživatel BEASTu specifikuje, neodpovídá skutečnému – marginálnímu či "indukovanému" – apriornímu rozdělení pro stáří uzlů. Pokud navrhneme konkrétní hodnotu pro stáří určitého kalibrovaného uzlu, BEAST pro ni spočítá indukovanou apriorní hustotu tak, že vynásobí kalibrační hustotu hustotou, kterou tomuto stáří pro daný uzel přiřazuje použitý model speciace. Přestože se indukované apriorní rozdělení může od kalibrační hustoty drasticky lišit, autorům analýzy zůstává víceméně skryto. Jediný způsob, jak zjistit jeho tvar, je nechat analýzu běžet s prázdnou datovou maticí, což ji nutí samplovat přímo z apriorního rozdělení. Ještě závažnější je, že tato "multiplikativní konstrukce" porušuje pravidla pravděpodobnostního počtu. Pokud dva jevy nejsou vzájemně nezávislé, pravděpodobnost jejich společného výskytu nelze spočítat prostým součinem, a je přinejmenším zvláštní předpokládat, že fosilní data jsou nezávislá na procesu, který generuje časy uzlů. Heled a Drummond proto navrhli využívat "podmíněnou konstrukci", ve které je marginální apriorní rozdělení shodné s kalibrační hustotou a model speciace se kalibracím přizpůsobuje (= je jimi podmíněn):

\begin{align}
f_C\left( t, \tau \,\middle\vert\, \Theta \right) & = f\left( t, \tau \,\middle\vert\, \Theta \right) f\left(t_C\right) & \mbox{multiplikativní konstrukce}\\
f_C\left( t, \tau \,\middle\vert\, \Theta \right) & = f\left( t_{NC}, \tau \,\middle\vert\, \Theta \right) f\left(t_C\right) & \mbox{podmíněná konstrukce}
\end{align}
kde $f_C(\cdot)$ je kalibrované marginální apriorní rozdělení, $t_C$ je stáří kalibrovaného uzlu, $t_{NC}$ je stáří nekalibrovaných uzlů a zbytek symbolů odpovídá rovnici (1). (Podle Heled & Drummond 2013.)

    Srovnání podmíněné a multiplikativní konstrukce na dříve publikovaném datasetu odhalilo až trojnásobné rozdíly v aposteriorních odhadech (Heled & Drummond 2012). Úspěch byl zpočátku jen částečný, protože autoři dokázali podmíněnou konstrukci aplikovat jen na Yuleův proces s jedinou kalibrací. O rok později Heled & Drummond (2013) rozšířili stejný postup i na proces množení a zániku s libovolným počtem kalibrací, ukázalo se však, že pro takto zobecněný problém neexistují řešení v uzavřeném tvaru a je nutno přejít k výpočetně mimořádně náročnému numerickému řešení.
    Ani podmíněná konstrukce navíc nedokáže vždy zabezpečit, aby uživatelem zadaná hustota odpovídala marginálnímu apriornímu rozdělení. Je-li jeden uzel vnořen do druhého, jsou jejich stáří evidentně vzájemně závislá – musí vyhovovat biologické podmínce, aby každý uzel byl mladší než jeho předci a starší než jeho potomci (Warnock et al. 2012; Heled & Drummond 2013; Heath & Moore 2014). Pokud jsou oba uzly kalibrovány a jejich kalibrační hustoty se překrývají (což nastane téměř vždy, protože všechny hustoty s výjimkou té uniformní mají tenký ocásek nízké pravděpodobnosti táhnoucí se do nekonečna), analýza je prostě ořízne. Marginální (skutečná) apriorní pravděpodobnost tedy bude ve výsledku opět odlišná od té zadané.

4. ... a co s nimi dělat

    V době publikování těchto studií už ale byla ale v plném proudu celá řada nezávislých pokusů, jak učinit bayesovské datování rigoróznějším. Nejkonzervativnější byli zřejmě Parham et al. (2012), kteří k problému přistoupili z čistě paleontologického hlediska a představili detailní protokol pro stanovování tvrdých minim a měkkých maxim, ilustrovaný na příkladu divergence mezi ptáky a krokodýly. K tomu nejdůležitějšímu – jaký průběh by měla mít křivka apriorní hustoty mezi minimem a maximem – se ale vyjádřili jen krátce v sekci "Future Directions", kde podpořili návrhy využít masivní databáze k odhadu faktorů zkreslujících pravděpodobnost dochování fosilií. O něco dál zašli Dornburg et al. (2011) při pokusu vzít v úvahu "Sppil-Rongisův" efekt*, podle kterého pravděpodobnost dochování ve fosilním záznamu roste s klesajícím stářím. Díky tomuto jevu můžeme očekávat, že většina kandidátů na fosilní kalibrace bude příliš mladá, než aby poskytla věrohodný odhad stáří divergence; budou to naopak ty fosilie, které svým vysokým stářím mezi ostatní nezapadají, které budou pro analýzu nejcennější. Dornburg a spol. se proto zaměřili na identifikaci a vyřazení nekonzistentních, příliš mladých fosilií.

*"Sppil-Rongisův" efekt je hříčkou na Signor-Lippsův efekt, který popisuje přesně opačnou situaci (a je pojmenován po skutečných lidech).

    Heath (2012) posunula celý problém o úroveň výš. Místo toho, aby hodnoty hyperparametrů stanovila arbitrárně, navrhla použít hierarchický bayesovský model, který je tahá z nového apriorního rozdělení (hyperprioru). Odhad stáří divergence potom bere v úvahu všechny hodnoty, kterých hyperparametry mohou nabývat, a to v poměru k jejich pravděpodobnosti (specifikované hyperpriorem). Analýza tedy hyperparametry marginalizuje – "vyintegruje". Jak ale sama autorka konstatovala v souvislosti s jinou aplikací hyperpriorů (Heath & Moore 2014), tento postup problém spíš jen odsouvá než řeší. Nemá-li se fylogenetik uchýlit k nekonečnému regresu, v nějakém bodě to prostě musí risknout, napevno stanovit hodnotu parametru vyššího řádu a doufat, že analýza bude na její volbu méně citlivá, než je tomu na nižších úrovních.

Princip hyperprioru. Parametr $\chi$ má lognormální apriorní hustotu (b), jejíž tvar určují hyperparametry $\mu$ (střední hodnota) a $\sigma$ (směrodatná odchylka). Pro stanovení druhého z nich použijeme hyperprior v podobě gama rozdělení (a), jehož tvar určují hyper-hyperparametry $s$ (tvar) a $\beta$ (rozsah). Integrací hustoty v (a) se lze vyhnout nutnosti udělit směrodatné odchylce arbitrární hodnotu, což ale stále musíme udělat o úroveň výše. (Zdroj: Heath 2012: Figure 2)

    Wilkinson et al. (2011) poukázali na to, že dosavadní způsob navrhování apriorních rozdělení odvrhuje všechny informace, které fosilní záznam poskytuje, s jedinou výjimkou tvrdého minima. Aby této ztrátě dat zabránili, použili autoři proces množení a zániku jako model speciace a dva modely samplingu, popisující pravděpodobnost nalezení fosilií. Parametry obou modelů (včetně mezery mezi datem divergence a nejstarší známou fosilií) jsou odhadnuty z databáze zachycující počty druhů fosilních primátů v různých geologických epochách. Odhad je přitom mimořádně obtížný, protože není znám tvar věrohodnostní funkce, která udává pravděpodobnost pozorovaných dat v závislosti na hodnotách parametrů. Řešením je provést simulaci, která vytáhne určité hodnoty parametrů, nasimuluje podle nich celou historii primátů (včetně topologie fylogenetického stromu a počtu fosilních nálezů) a v závislosti na detailech této historie si ony hodnoty buď ponechá, nebo je odmítne (např. tehdy, pokud je kořen stromu mladší než nejstarší fosilie, pokud simulace nechala vymřít jednu z větví, která ve skutečnosti přežila do současnosti, nebo pokud odhadované počty fosilních nálezů příliš hrubě nesedí na skutečný fosilní záznam). Tato metoda však nejenže nevzorkuje z pravého aposteriorního rozdělení (jen z rozdělení, které jej aproximuje), ale je navíc příliš časově náročná. Wilkinson et al. (2011) ji tedy nahradili jiným přibližným postupem, využívajícím složitou kombinaci nejrůznějších bayesovských algoritmů. Poměrně vágní výsledná rozdělení pak už využili jako klasické kalibrační hustoty pro analýzu sekvenčních dat.

5. Konec kalibrací: tip-dating

    Nejradikálnějším řešením by bylo kalibrační hustoty úplně vypustit a fosilie do analýzy zahrnout jako plnohodnotné koncové taxony neboli špičky (tips). Výhodu by to mělo ještě v jednom ohledu: kromě všech výše zmíněných problémů (subjektivita, nejasné interakce mezi kalibracemi navzájem i s jinými priory, omezené využití dostupného fosilního záznamu) musejí být fosilní kalibrace navíc napevno přiřazeny k určitému uzlu. Pokud ale chceme provést sdružený odhad topologie a stáří uzlů, měli bychom existenci jakéhokoli uzlu testovat, nikoli předpokládat. Pokud např. použijeme vegavise ke kalibraci divergence mezi kachnovitými (Anatidae) a husovcem (Anseranas), implicitně si tím vynucujeme monofylii kladu (husovec + kachnovití). To může vést k přehnané podpoře pro kalibrované uzly či odhady jejich stáří (Ronquist et al. 2012). Výjimkou je v tomto směru BEAST, který umí fosilní kalibraci přiřadit poslednímu společnému předkovi zadaných taxonů bez ohledu na to, jak obsáhlý je klad, který tímto předkem vzniká. Monofylii žádných uzlů si tedy nevynucuje. I v BEASTu ale platí, že fosilie nemají volnost zapadnout do libovolných míst stromu. Jejich příbuzenství s žijícími taxony je napevno nastaveno před analýzou, nikoli odhadováno coby její součást, a v praxi je přitom často nastaveno špatně. Do jisté míry je vina na straně molekulárních biologů, kteří nejsou dostatečně obeznámeni s paleontologickou literaturou a řídí se zastaralými údaji, protože si nevšimli nových interpretací kalibračních fosilií; do jisté míry jde o prostý důsledek faktu, že většina relevantních fosilií nebyla nikdy podrobena fylogenetické analýze. Např. u ptáků jsou špatně identifikované fosilie pro datovací analýzy chronickým problémem (Mayr 2005, 2013; Ksepka 2009).
    Už nějakou dobu jsou přitom k dispozici modely evoluce pro morfologické znaky, které umožňují provést společnou (total-evidence) bayesovskou analýzu molekulárních a morfologických dat (Lewis 2001; Nylander et al. 2004). Mezi prvními, kteří se je pokusili využít k odhadu fylogenetické pozice kalibračních fosilií, byli Lee et al. (2009), jejichž postup byl celkově velmi neobvyklý. Autoři provedli klasickou (bezčasovou) analýzu kombinovaného morfologicko-molekulárního datasetu zahrnujícího kalibrační fosilii. Pro každý z 1000 nasbíraných stromů – bez ohledu na to, kde na něm fosilie stála – pak provedli oddělenou datovací analýzu semiparametrickým uhlazováním tempa evoluce. Nakonec sestrojili konsenzovou topologii, přičemž konfidenční intervaly pro stáří jejích uzlů spočítali přes všechny topologie. (Pokud např. poslední společný předek A a B byl na jednom stromě také předkem C, D a E a na druhém stromě ne, jeho stáří na konsenzovém stromě bylo zprůměrováno přes obě možnosti.) Lee a spol. tedy sice učinili výrazný pokrok tím, že vzali v úvahu nejistotu o fylogenetické pozici kalibrační fosilie, ale neprovedli skutečný sdružený odhad topologie a datace. Stromy, které získali, nebyly kalibrované a musely být datovány v odděleném, druhém kroku analýzy. Důvod, proč Lee a spol. zvolili tuto nepříliš spolehlivou kombinaci metod místo BEASTu, byl poměrně prozaický: BEAST v té době ještě neuměl analyzovat morfologické znaky.
    Daleko více se ideálu přiblížil Pyron (2011), který využil faktu, že BEAST naopak už poměrně dlouho umožňoval kalibrovat strom nejen přiřazením fosilií k jeho uzlům, ale také zahrnutím špiček různého stáří. Drummond et al. (2006) tento typ kalibrace předvedli na příkladu virových sekvencí samplovaných v průběhu 17 let, nic ale nebrání aplikaci stejného principu na fosilie staré desítky či stovky milionů let. Od doby, co svou práci publikovali Lee a spol., byl už BEAST navíc doplněn o modely morfologické evoluce, a sdruženému total-evidence odhadu fylogeneze a stáří tedy už nic nestálo v cestě. Pyron použil 41 fosilií, z nichž pouhé 3 však spadaly do ingroup, tj. skupiny zájmu. Provedl dvě analýzy, z nichž v jedné byl model rychlostí evoluce (nekorelovaný lognormální) společný pro molekulární i morfologické znaky, zatímco v druhé obě sady dat obdržely samostatné modely. Autor nesdělil, jaký model speciace použil, což je znepokojivé, protože většina dostupných modelů se pro stromy s různě starými špičkami vůbec nehodí (viz níže).
    Ronquist et al. (2012) k problému přistoupili důkladněji a zkompilovali rozsáhlý dataset žijících i fosilních blanokřídlých s velkým překryvem mezi morfologií a molekulami (téměř všechny žijící taxony byly samplovány na oba typy dat), kde se většina fosilií soustředila v rámci ingroup. Na rozdíl od Pyrona věnovali velkou pozornost výběru modelu speciace. Yuleův proces, který předpokládá nulové tempo vymírání, je evidentně nevhodný – pokud není každá analyzovaná fosilie předkem jiného taxonu, budou jeho předpoklady silně narušeny (Heath & Moore 2014). Proces množení a zániku je realističtější a byl rozšířen i na případy, kdy jsou špičky stromu samplovány z více než jednoho časového horizontu (Stadler 2010; Stadler & Yang 2013), je ale velmi citlivý na velikost a výběr vzorku. Z koalescenčního procesu lze spočíst pravděpodobnostní hustotu pro stromy se špičkami o různém stáří celkem jednoduše, Ronquist a spol. jej však zamítli s tím, že se hodí více pro genové stromy než druhové stromy odhadované z kombinovaných dat. Místo toho se rozhodli zobecnit uniformní apriorní rozdělení pro datované topologie na stromy s různě starými špičkami. Ve výsledném modelu speciace jsou stáří uzlů tahána z uniformních rozdělení s maximem ve stáří kořene a minimem ve stáří špičky. Strom se sestrojí tak, že v každém vnitřním uzlu, od nejmladšího po ten nejstarší, necháme splynout dvě náhodně vybrané linie existující v daném čase. S tímto modelem Ronquist et al. (2012) provedli celou řadu analýz. Jejich úplný přehled poskytuje flowchart přetištěný níže; stručné shrnutí postupu nabízím pod ním:

Easy, right? (Zdroj: Ronquist et al. 2012: Figure 1)

  1. Sestav molekulární dataset $D_1$ pro žijící zástupce taxonu $T$.
  2. Sestav morfologický dataset $D_2$ pro žijící zástupce $T$ (ideálně tak, aby se překrýval s $D_1$).
  3. Sestav morfologický dataset $D_3$ pro relevantní fosilie z taxonu $T$.
  4. Zkombinuj $D_1$ a $D_2$ do total-evidence datasetu $D_{1+2}$.
  5. Proveď bezčasovou bayesovskou analýzu $A_1$ datasetu $D_{1+2}$, která ověří, zda je $D_{1+2}$ schopen rozřešit příbuzenské vztahy uvnitř $T$, a ukáže, zda jsou mezi jednotlivými větvemi podstatné rozdíly v rychlosti evoluce.
  6. Ponech si takovou topologii $\tau$ z $A_1$, která má nejvyšší aposteriorní pravděpodobnost.
  7. Použij bezčasovou analýzu $A_2$ a analýzu $A_3$ se striktními molekulárními hodinami k odhadu délek větví pro $\tau$.
  8. Nastav apriorní pravděpodobnosti pro analýzy využívající různé modely relaxovaných hodin ($A_{TK02}$, $A_{CPP}$ a $A_{IGR}$) podle kroků 9 a 10.
  9. Sestroj graf závislosti rozptylu délek větví z $A_2$ na čase (měřeném pomocí $A_3$) a prolož jím regresní přímku. Použij její sklon ke stanovení hyperpriorů pro jednotlivé modely rychlostí evoluce: pro $A_{IGR}$ přímo, pro $A_{TK02}$ a $A_{CPP}$ pomocí simulace.
  10. Otestuj, nakolik je výška stromu* v analýzách se striktními hodinami citlivá na různé apriorní pravděpodobnosti. Vyděl medián aposteriorního rozdělení výšek stromů odhadem stáří taxonu $T$ založeným na fosilní kalibraci. Použij výsledek jako střední hodnotu apriorního rozdělení pro rychlosti evoluce.
  11. Použij Bayesův faktor k porovnání, jak si vedou $A_{TK02}$, $A_{CPP}$ a $A_{IGR}$ při použití kalibračních hustot (dataset $D_{1+2}$ + fosilní kalibrace) a při zahrnutí fosilií jako špiček (dataset $D_{1+2+3}$).
*Výška stromu (tree height, root height) je součet délek větví oddělujících kořen stromu od jeho nejvzdálenější špičky. Stejně jako délku větví ji lze měřit buď v očekávaném počtu změn na znak, nebo v letech. V druhém případě je výška stromu synonymem pro stáří posledního společného předka všech analyzovaných taxonů.

    Co se topologie týče, nejlepší výsledky podala bezčasová analýza. Striktní molekulární hodiny odkryly bizarní topologii, ve které hmyz s dokonalou proměnou (Holometabola) netvořil monofyletickou skupinu; ani vynucení jeho monofylie ale zbytek stromu "nespravilo". Stromy založené na relaxovaných hodinách byly obdobně nedůvěryhodné (v topologii vzešlé z IGR, kterou autoři přetiskli, už nebyla monofyletická ani ingroup, tj. blanokřídlí; jedna její část měla blíž k taxonům s nedokonalou proměnou), ale po vynucení monofylie Holometabola se vrátily k normálu. Ronquist et al. (2012) proto doporučují nadále používat k zakořeňování stromů outgroup – dokonce i v analýzách s relaxovanými hodinami, které ji technicky vzato nepotřebují. Srovnání relaxovaných hodin na základě Bayesova faktoru při použití fosilních kalibrací favorizovalo autokorelované modely (TK02 a CPP), což není překvapivé, protože přítomnost slabé autokorelace v rychlostech evoluce už předtím potvrdil přídavný rozbor. Použití fosilií jako špiček ale pořadí modelů prudce změnilo: TK02 se propadl, IGR se vyrovnal CPP nebo ho dokonce překonal. Výsledky z IGR také údajně lépe sedí na fosilní záznam, protože nevyžaduje tak dlouhé mezery bez známých fosilií (ghost lineages). (Nejsem si jistý, zda tohle autorům věřit. IGR obecně odkrývá staré korunní klady a krátké kmenové linie, což by mělo ghost lineages spíš prodlužovat.)
    Nejzajímavější jsou ale rozdíly mezi klasickým datováním pomocí kalibrací a tip-datingem. Je dobré uvést, že ani analýza s fosilními špičkami nebyla zcela prosta kalibrací (stejně jako u Pyrona). Ronquist a spol. kalibrovali kořen stromu, jak vyžadoval jejich uniformní model speciace, a kořen Holometabola, kde by odstranění kalibrace vyžadovalo zahrnutí řady dalších fosilií pro outgroup. Hraní si se střední hodnotou příslušných kalibračních hustot (ekvivalentní tomu, co dělali Warnock et al. 2012) ale ukázalo, že tip-dating analýza je na kalibrace méně citlivá než klasický postup. Rozdílné byly i výsledky: datování pomocí špiček odkrylo mladší data pro uzly mimo blanokřídlé a dva uzly uvnitř blanokřídlých, všude jinde byla naopak výsledná stáří vyšší než za použití kalibrací. Tip-dating byl také přesnější, což se projevilo užšími 95% intervaly nejvyšší aposteriorní hustoty. Snad nejvíc se ale výhody této metody projevily ve výsledné fylogenetické pozici zahrnutých fosilií. Ta byla v mnoha případech extrémně nejistá a aposteriorní pravděpodobnost i toho nejlepšího odhadu občas nepřesáhla 0,3. Ze sedmi fosilií, které byly přiřazeny ke konkrétním uzlům v analýzách s kalibracemi, jen tři zaujaly stejnou pozici v total-evidence analýze s aposteriorní pravděpodobností vyšší než 0,5. Ve dvou případech dokonce aposteriorní pravděpodobnost pozice, která byla předpokládána pro analýzu s kalibracemi, činila přesně 0.

Srovnání 95% intervalů nejvyšší aposteriorní hustoty z datace založené na kalibračních hustotách (modré pruhy) a z total-evidence datace s fosilními špičkami (červené pruhy). Topologie stromu pochází z druhé ze jmenovaných analýz a od topologie založené na kalibracích se liší ve dvou uzlech. Bílé šipky ukazují, jakým směrem a o kolik se posunul medián stáří uzlu v tip-datingu oproti analýze s kalibračními hustotami. Je vidět, že zatímco u báze stromu poskytoval tip-dating mladší výsledky, uvnitř blanokřídlých tomu bylo téměř vždy naopak. (Zdroj: Ronquist et al. 2012: Figure 9)

    Autoři se také věnovali otázce, zda morfologickým a molekulárním datům dát oddělené modely rychlostí evoluce, nebo použít jediný model společný. Zvolili druhou možnost, a to ze dvou důvodů. První z nich byl pragmatický: významný nárůst v počtu parametrů (rychlostí) by mohl zkomplikovat konvergenci MCMC a hrozí, že výsledný model by byl přeparametrizovaný. Druhým důvodem je, že délky větví na bezčasových stromech založených na morfologii a na molekulách spolu jasně korelují (tzn., že větve, které jsou dlouhé na jednom stromě, jsou dlouhé i na druhém). Ronquist a spol. ale zdůrazňují, že i oddělené modelování stojí za další výzkum.
    V závěru autoři konstatují, že tip-dating by měl být upřednostněn před klasickým přístupem založeným na kalibracích kdekoli, kde je to jen možné. Informace z fosilií začleňuje přímo a nespoléhá na druhotné interpretace, které mohou být chybné. Podává rovněž přesnější výsledky, což ukazuje, že s fosiliemi pracuje efektivněji. V neposlední řadě má používání fosilií coby špiček motivovat autory, aby se zaměřili na dosud spíše přehlížené aspekty datování – studium fosilií a jejich morfologických znaků, modelování morfologické evoluce a vývoj sofistikovanějších modelů speciace.

6. Reakce a kritika

    Celkové přijetí postupů Pyrona (2011) a Ronquista a spol. (2012) se zdá být poměrně entuziastické. Vzhledem k tomu, že tip-dating je nyní dostupný v obou velkých softwarových balíčcích pro bayesovskou fylogenetiku (MrBayes 3.2 a BEAST), studií využívajících této metody rychle přibývá: Lee et al. (2013); Slater (2013); Wood et al. (2013); Near et al. (2014); Tseng et al. (2014). Líbí se mi, že hned dvě práce z tohoto stále dosti úzkého okruhu se zabývaly fosilními pan-aviany – o těch budu psát v příštích dvou dílech této série. Ne vždy se ale tento přístup ukázal být spolehlivým. Vilhelmsen & Zimmermann (2014), kteří se pokusili k datování využít výhradně morfologické znaky, zaznamenali, že pro některé uzly činil rozptyl odhadovaných stáří přes 300 milionů let – jak sami konstatují, zřejmě proto, že jejich analýza obsahovala příliš málo fosilií v poměru k žijícím taxonům. Lee et al. (2013) zjistili, že zatímco tip-dating v BEASTu pro jejich dataset funguje bezproblémově, MrBayes měl v kombinaci s modelem IGR potíže s konvergencí, a pokud zkonvergoval, pak na naprosto bizarních stromech. Vysoce nespolehlivé byly i odhady rychlostí evoluce, které v některých případech kolísaly o šílených osm řádů.
    Dostupnost tip-datingu také nutí autory, aby explicitně odůvodnili další užívání kalibrací. Příkladem je např. nedávná studie o původu pěvců (Ericson et al. 2014; na blogu krátce zde), na které se podílela i jedna ze spoluautorek Ronquista a spol. (2012) a která použila stejný zobecněný uniformní model speciace – avšak pro tradiční analýzu s kalibračními hustotami. Autoři přiznali, že přímé zahrnutí fosilií představuje lepší postup, konstatovali však, že rozsáhlé datasety s velkým počtem morfologických znaků kódovaných pro žijící i fosilní taxony nejsou pro většinu skupin dostupné. Podobně argumentovaly i jiné studie.
    Některé práce zašly dál a nabídly kritický pohled na tip-dating. Heath & Moore (2014) označují za možný problém této techniky chybějící data. Pro tip-dating jsou potřeba datové matice, které kombinují morfologické a molekulární znaky. Vzhledem k tomu, že od fosilií téměř nikdy žádná molekulární data nemáme (i ze subfosilních taxonů typu sloních ptáků je velmi těžké vytáhnout aspoň kompletní mitochondriální genom), jsou tyto matice plné nenáhodně rozložených chybějících dat. To sice nemusí nutně zkreslit topologii, může to ale zasáhnout délky větví (a tím pádem i stáří uzlů). Je ale fér uvést, že jak Pyron (2011), tak i Ronquist et al. (2012) se pokusili tento problém adresovat. První jmenovaný hledal korelaci mezi délkou větve a množstvím dat známým od taxonu na jejím konci; žádné zkreslení odhadů stáří ale neodhalil. Ronquist a spol. vycházeli z předpokladu, že pokud nekompletnost fosilií zkresluje délky větví, ty nejméně kompletní by je měly zkreslovat nejvíce. Vyřazení fosilií, které byly kódovány pro méně než 10% morfologických znaků, ale vyprodukovalo téměř shodné mediány stáří uzlů, jaké odhalila kompletní analýza. Autoři proto usoudili, že informace, které fosilie poskytují, přebíjejí problémy plynoucí z jejich nekompletnosti.
    Heath & Moore (2014) také uvádějí, že není jisté, do jaké míry lze evoluci morfologických znaků popsat (relaxovanými) hodinami. Přijímají sice argumenty Ronquista a spol., podle kterých je určitá korelace mezi morfologickou odlišností dvou taxonů a dobou uplynulou od jejich divergence nevyhnutelným důsledkem evoluce, namítají ale, že morfologické hodiny mohou "tikat" jiným tempem než ty molekulární. Pyronův postup, ve kterém jsou morfologickým a molekulárním datům přiděleny samostatné modely rychlostí evoluce, sice tento problém zdánlivě řeší, viz ale poznámku výše o přeparametrizaci a obtížné konvergenci. Zdá se tedy, že ideální je řídit se protokolem Ronquista a spol., analyzovat nejprve oba typy dat odděleně a porovnat, jak spolu korelují výsledné délky větví či stáří uzlů. Heath a Moore dále argumentují, že selekční tlaky, kterým morfologie podléhá, mohou způsobovat heterotachii – jev, kdy se rychlosti evoluce liší jak mezi znaky, tak napříč stromem.* Pak by byl předpoklad, že jediné hodiny platí pro všechny morfologické znaky, zjevně chybný. Možným protiopatřením (dodávám já) by bylo rozdělit morfologický dataset na několik oddílů, např. podle Bayesova faktoru – jak to udělali Clarke & Middleton (2008) ve své bezčasové bayesovské analýze ptačí morfologické evoluce – a každému přidělit samostatný model rychlostí evoluce; zde ale opět vyvstává riziko přeparametrizace.

*Heterotachie nesmí být zaměňována za prosté rozdíly v rychlosti evoluce napříč znaky (rates-across-sites heterogeneity, RAS). Existující modely morfologické evoluce adresují RAS a u každého znaku sčítají přes několik rychlostních kategorií, stále ale předpokládají, že poměr délek větví zůstává v každé kategorii konstantní. Pokud tedy znak 1 prodělá na větvi A 0,03 substitucí a znak 2 0,05 substitucí, na třikrát delší větvi B musí znak 1 prodělat 0,09 substitucí a znak 2 0,15 substitucí. Pokud ale evoluce podléhá heterotachii, počet substitucí na větvi B může činit 0,09 pro znak 1 a např. 0,02 pro znak 2. Chceme-li se s heterotachií vypořádat při modelování evoluce, musíme pro oba znaky specifikovat jinou sadu délek větví. Krátce jsem o tom na blogu psal zde.

Výsledky tip-datingu Ronquista a spol. Malé rozlišení stromu způsobují nekompletní fosilie s nejistou pozicí: odstíny šedé v políčkách vpravo ukazují, pro kolik morfologických znaků byl daný taxon kódován. Čísla nad uzly udávají aposteriorní pravděpodobnost. (Zdroj: Ronquist et al. 2012: Figure 7)

    Poslední kritika Heathové a Moore'a se týká nedostatku modelů speciace vhodných pro tip-dating. Zobecněný uniformní model Ronquista a spol. podle autorů není biologicky smysluplným popisem procesů, které generují strom (Heath & Moore 2014: 315). Takový popis by měl zahrnovat jak diverzifikaci, tak i uchovávání fosilií a jejich sampling. První pokroky v tomto směru už ale byly učiněny (viz níže)
    Tip-dating byl diskutován i z čistě paleontologického hlediska. Prvním v tomto směru byl zřejmě Laurin (2012), jehož kritika ale byla dost neinformovaná. Podle něj datování s fosilními špičkami vyžaduje, aby byly na morfologickou evoluci aplikovány modely původně vyvinuté pro molekulární data. Větší složitost morfologických znaků má přitom snižovat pravděpodobnost, že jednoduchý model bude pro jejich evoluci adekvátním popisem. (Častý omyl: model je vždy zjednodušený, nikdy nemá jít o detailní a realistický popis modelovaného systému.) Za největší překážku Laurin považuje fakt, že zatímco modely evoluce vyžadují nezkreslený vzorek všech znaků, skoro všechny existující morfologické datasety zahrnují jen znaky informativní pro parsimonii (čili znaky, kde je každý stav přítomen minimálně u dvou taxonů). Už dlouho je ale dostupný model, který takto zkreslený výběr znaků dokáže korigovat (Nylander et al. 2004), ačkoli zatím jen v programu MrBayes. Jeho statistické vlastnosti detailně analyzovali Allman et al. (2010), kteří dokázali, že s 8 a více taxony jsou jeho parametry identifikovatelné, a poskytuje tedy statisticky konzistentní odhad fylogeneze. Laurin dále argumentuje, že tip-dating může být poněkud nepraktický kvůli nedostatku velkých morfologických datasetů, přesto ale uznává jeho potenciál (Laurin 2012: 13).
    Pro paleontology je tip-dating obzvlášť zajímavý v souvislosti s rostoucím zájmem o evoluci znaků. Jak konstatuje Bapst (2014), v poslední době začali paleontologové přebírat neontologické metody (vyvinuté pro molekulární fylogeneze se stejně starými špičkami) k výzkumu takových otázek, jako "Proběhla v nějaké skupině nebo časovém intervalu změna relativní rychlosti evoluce určitého znaku?" nebo "Jaký je vztah mezi znaky, či mezi znakem a určitým faktorem prostředí?". Tyto metody ale vyžadují datované stromy, které parsimonie – v paleontologii nejpoužívanější fylogenetická metoda – nedokáže poskytnout. Simultánní odhad topologie a stáří uzlů pro fosilní taxony by byl ideální, a řada paleontologů do něj proto vkládá velké naděje (Bapst 2013, 2014; Slater & Harmon 2013). I zde se ale objevují určité výhrady. Tou nejčastější je, že dostupné implementace tip-datingu neberou v úvahu procesy, které ovlivňují výběr použitého vzorku taxonů – především frekvenci uchovávání a nalézání fosilií. Zpřesnění by mohly přinést modely, ve kterých jsou tempa fosilizace tahána z určitého pravděpodobnostního rozdělení, se samostatným rozdělením pro každou biogeografickou oblast (Slater & Harmon 2013). Bapst (2013) také podotýká, že existující bayesovské metody nedokážou pracovat se vztahy typu předek-potomek, což může při nakládání s fosilním záznamem představovat problém. Pennell & Harmon (2013) se rovněž vracejí k problému nenáhodně rozložených chybějících dat, považují jej ale spíš za riziko pro následovné analýzy znakové evoluce než pro tip-dating samotný.

7. Kde jsme teď

    Jak již bylo řečeno, tip-dating byl přijat s entuziazmem a rychle se rozšiřuje. Tento trend bude téměř jistě pokračovat: podle Bapsta (2014) nejenže mají bayesovské analýzy s fosilními špičkami šanci stát se převládající metodou pro tvorbu datovaných paleontologických stromů, ale mohou se stát sjednocujícím přístupem aplikovatelným na širokou škálu datasetů, pro které zatím potřebujeme řadu různých ad hoc metod.
    Do budoucna lze bezesporu očekávat další zlepšování metod navržených Pyronem (2011) a Ronquistem a spol. (2012). Ukázku takového zlepšení nedávno nabídli Heath et al. (2014), kteří vyvinuli nový model speciace, nazvaný "fosilizovaný proces množení a zániku" (Fossilized Birth-Death Process, FBD). Ten vůbec poprvé předpokládá, že fosilie jsou produktem stejného větvícího procesu, který generuje zbytek stromu. Přestože model předpokládá konstantní tempo speciace, vymírání a fosilizace, detailní simulace ukázaly, že je vůči narušení těchto předpokladů velmi robustní: ani zkreslený výběr fosilií, ani zkreslený výběr žijících taxonů nemá na výsledné odhady stáří vliv; a pokud se zajímáme jen o stáří uzlů a nikoli o celou komplexní makroevoluční dynamiku, lze tempa speciace, vymírání a fosilizace vyintegrovat jako náhodné proměnné. FBD je navíc použitelný jak pro tip-dating, tak i pro klasické analýzy založené na kalibracích, ze kterých ale odstraňuje nutnost používat kalibrační hustoty. Místo toho poskytuje sjednocené apriorní rozdělení pro kalibrované i nekalibrované uzly, a dokonce umožňuje vzít v úvahu i nejistotu ohledně fylogenetické pozice fosilií.

8. Acknowledgments

    Děkuji Tracy Heathové za to, že mi poslala kopii své vynikající práce shrnující dostupné metody bayesovského datování, a Davidu Bapstovi za přístup k řadě dalších studií citovaných v tomto článku, včetně jeho vlastních prací.

Zdroje: