Poslední příspěvky na blogu se věnovaly bayesovskému molekulárnímu datování: problémům s ním spojeným, výsledkům, které podává v případě ptačí evoluce, a kontroverzím, které tyto výsledky vyvolávají. Možná by proto stálo za to podívat se i na jeho metodologickou stránku, a to se zvláštním ohledem na nový slibný postup, který zapojuje fosilie do datování daleko důkladněji, než tomu bylo dříve. Skvělou příležitost k tomu nabízejí dvě letošní studie, které tuto novou metodu aplikují na neptačí dinosaury a které budou předmětem následujících dílů této série.
1. Bayesovské datování
1. Bayesovské datování
Většina parametrických fylogenetických analýz odhaduje nejen topologii a parametry evolučního modelu, ale také délky větví. Délka je definována jako součin stáří větve a rychlosti, s níž se větev vyvíjí: $l = \mu \times t$. Tradiční modely předpokládají, že délky větví jsou nezávislé a identicky distribuované. To je jednak z biologického hlediska těžko ospravedlnitelné (očekávali bychom, že délky dceřiných větví budou aspoň nějak souviset s délkou větve mateřské), jednak to neumožňuje odhadovat ani rychlost evoluce, ani data divergencí – zjistit můžeme jen jejich součin, ve kterém nelze relativní příspěvky stáří a rychlosti nijak oddělit od sebe (Drummond et al. 2006). Analýzy tohoto typu bývají někdy označovány jako "bezčasové" (time-free) (Wertheim et al. 2010). Důvodem, proč byl tento nerealistický přístup tak dlouho tolerován, je fakt, že jedinou alternativu dlouho představoval ještě horší model molekulárních hodin, který předpokládá, že rychlost evoluce je u všech vývojových linií konstantní. Přijmeme-li tento předpoklad, datování divergencí se stává nejen možným, ale přímo triviálním. Při konstantní rychlosti evoluce je totiž délka každé větve je přímo úměrná jejímu stáří, a stačí tedy zjistit koeficient úměrnosti pomocí nějaké fosilní kalibrace – pak už lze očekávané počty substitucí přímo přepočítat na miliony let. Právě tak postupovali v 80. a 90. letech v ptačí fylogenetice Sibley a Ahlquist, už tehdy však začínalo být jasné, že předpoklad globálních hodin je neudržitelný.
Prostřední pozici mezi oběma extrémy, tj. předpokladem totální nezávislosti délek větví na jedné straně a striktními molekulárními hodinami na straně druhé, se podařilo najít až na konci 90. let v tzv. relaxovaných hodinách (relaxed-clock models). Spolu s tím se otevřel prostor pro robustnější datovací metody. Většina datovacích analýz využívajících relaxované hodiny je prováděna v bayesovském frameworku a zahrnuje tři klíčové složky (podseznamy nejsou zamýšleny jako vyčerpávající):
K analýze je možné přidávat i další prvky (lze si např. vynutit monofylii některých uzlů), tyto tři jsou však nutným základem. Abychom odlišili, jak se na celkovém množství změn (= délce větve) podílí rychlost a jak čas, musíme učinit určité předpoklady o tom, jak se rychlost evoluce mění napříč stromem (1). Pokud tento model rychlostí (1) zkombinujeme s modelem pro časy uzlů (2), znovu se dostáváme tam, kde jsme byli u striktních molekulárních hodin. Délka větve je přímo úměrná jejímu stáří, a jde tedy o odhad relativního času divergence. Konstantu úměrnosti, která relativní stáří převede na stáří absolutní, dodá jedna nebo více fosilních kalibrací (3). Přesný tvar každého z těchto tří apriorních rozdělení popisují hyperparametry**. Jedna sada hyperparametrů určuje např. tvar rozdělení, ze kterého taháme rychlosti pro jednotlivé větve stromu (1). Další potřebujeme pro model speciace (2): Yuleův proces je popsán jedním hyperparametrem, proces množení a zániku dvěma. Konečně i tvar kalibračních hustot (3) je nutné stanovit touto formou. Provádíme-li sdružený odhad topologie a stáří jejich uzlů, jak je běžné v dnešních analýzách, lze podle Bayesovy věty celý proces zapsat jako
\begin{equation}
f\left( \tau, t, r, \Theta, \Phi, \Omega \,\middle\vert\, \boldsymbol{X} \right) = \frac{f(\tau \,\vert\, \Theta) f(t \,\vert\, \Theta) f(r \,\vert\, \Phi) f(\Theta) f(\Phi) f(\Omega) f(\boldsymbol{X} \,\vert\, \tau, t, r, \Omega)}{f(\boldsymbol{X})} \\
\end{equation}
kde $\tau$ je topologie fylogenetického stromu, $t$ je vektor (uspořádaná n-tice náhodných veličin) stáří uzlů, $r$ je vektor rychlostí evoluce, $\Theta$ je vektor obsahující hyperparametry modelu speciace, $\Phi$ je vektor obsahující hyperparametry modelu rychlosti evoluce, $\Omega$ je vektor obsahující parametry modelu molekulární evoluce a $\boldsymbol{X}$ jsou sekvenční data. (Podle Drummond et al. 2006, Heath & Moore 2014.)
*Ačkoli v bayesovské inferenci "apriorní pravděpodobnost" a "model" neznamenají totéž (apriorní pravděpodobnost je na modelu závislá: $\mathrm{Pr}(\theta) = \mathrm{Pr}(\theta \,\vert\, M)$), v tomto kontextu jsou oba pojmy používány jako vzájemně zaměnitelné – např. "birth-death prior" a "birth-death model".
**Apriorní rozdělení popisuje pravděpodobnost, jakou různým hodnotám parametru přiřazujeme předtím, než provedeme analýzu dat. Parametry, které popisují tvar apriorního rozdělení, jsou označovány jako hyperparametry, a apriorní rozdělení hyperparametrů se nazývá "hyperprior" (viz níže).
Z rovnice (1) je patrné, že zatímco pro model rychlostí i model speciace jsou hyperparametry odhadovány (analýza hledá jejich aposteriorní rozdělení), v případě kalibračních hustot tomu tak není. Jejich tvar musí být nastaven ještě před analýzou, a právě z této skutečnosti vyplývá celá řada problémů.
2. Kalibrační hustoty
Samo konstruování kalibračních hustot je přitom relativní novinkou. Ve starších datovacích analýzách bývalo stáří kalibrační fosilie přímo ztotožňováno se stářím divergence, což je zjevně neuspokojivé – kalibrační fosilie využívaná ke kalibraci je produktem divergence, kterou má datovat. Musí tedy být zákonitě o něco mladší, dokonce o tolik mladší, aby už disponovala morfologickými znaky charakteristickými pro jednu stranu této divergence. Skutečné stáří uzlu bude nejspíš o několik milionů let vyšší, než je stáří kalibrační fosilie, a díky neúplnosti fosilního záznamu vždy existuje i malá (ale nenulová) pravděpodobnost, že tento rozdíl bude ještě podstatně větší. Fosilní záznam tedy striktně vzato dovoluje pouze stanovení dolních hranic, čili minimálního stáří divergence. Máme-li fosilii 1, starou 50 milionů let, která spadá do kmenové linie taxonu A, víme, že divergence mezi A a jeho nejbližším žijícím příbuzným B musí být starší než 50 milionů let: stáří fosilie představuje tvrdou dolní hranici (hard lower bound) pro stáří divergence. Z principu ale nemůže existovat fosilie, jejíž stáří by nutně muselo být vyšší než stáří divergence. Pokud bychom např. objevili 60 milionů let starou fosilii 2, která by spadala do kmenové linie celého kladu A+B, pořád to neznamená, že divergence mezi A a B nemůže být stará např. 90 milionů let:
Z řad paleontologů přesto zaznívají argumenty, že někdy horní hranice stanovit lze. Příkladem může být situace, kdy má korunní klad celou řadou vymřelých příbuzných, jejichž stáří přibližně koresponduje s fylogenetickou pozicí (tj. čím bazálnější, tím starší):
Obdobně by šlo argumentovat, že někdy je fosilní záznam natolik kompletní, že pokud v určitém období nějakou skupinu nenalézáme, jde o dostatečně silný důkaz, že ještě neexistovala. Tento argument je často zmiňován v kontroverzi o stáří moderních ptáků – z rané křídy, do které umisťují původ neornitů některé molekulárnědatovací studie, známe několik lokalit s velmi bohatou avifaunou (Yixian, Jiufotang), ve které ale není po moderních ptácích ani stopy. Marjanović & Laurin (2007) argumentovali, že pokud datovací analýza zahrnuje horní hranice, výsledné odhady jsou realističtější, zatímco výhradní užívání dolních hranic má tendenci stáří uzlů podhodnocovat.
Ačkoli tedy maxima mohou být užitečná, zůstává otázkou, jak je implementovat. Tvrdé horní hranice (hard upper bounds), analogické tvrdým dolním hranicím popsaným výše, jsou problematické hned z několika důvodů. Tím nejpodstatnějším je zřejmě fakt, že nemohou být "přehlasovány" žádným množstvím dat. Pokud se výše nastíněné úvahy o kompletnosti fosilního záznamu někde seknou a pravé datum divergence bude starší než tvrdé maximum, analýza jej nikdy neodhalí. Existuje ale i opačný problém: pokud budeme příliš opatrní a tvrdou dolní hranici posuneme příliš daleko do minulosti ve snaze vyhnout se předchozímu problému a nezamítat a priori ani málo pravděpodobná vysoká stáří, odhady budou vycházet nerealisticky staré (Yang & Rannala 2006).
Bayesovský přístup k fosilním kalibracím umožňuje tyto problémy elegantně obejít – nikoli však proto, že by šlo o naprostý převrat, jako spíš tím, že šikovně zobecňuje dřívější praxi. Autoři prosazující používání tvrdých maxim stanovili tvrdou dolní i horní hranici a výsledný odhad nechali spadnout kamkoli mezi ně čistě podle toho, co říkají data. Z bayesovského hlediska bychom to mohli vnímat tak, že (implicitně) stanovili uniformní apriorní rozdělení pro interval $(\min, \max)$. Není však důvod, proč by rozdělení muselo být uniformní. Naopak, výše uvedená fakta ukazují, že ideální by bylo zkonstruovat takové apriorní rozdělení, které nejvyšší pravděpodobnost přiřadí datům o pár milionů let starším, než je stáří kalibrační fosilie, a do hlubší minulosti nechá vyčnívat dlouhý "ocásek" nízké (ale ne nulové) pravděpodobnosti. Existují rozdělení, jejichž tvar přesně takovým požadavkům odpovídá – např. exponenciální nebo lognormální.
Začlenit do tohoto frameworku horní hranice je již jednoduché: stačí si pohrát s hyperparametry (udávajícími přesný průběh funkce apriorní hustoty pravděpodobnosti) tak, aby se přesně specifikovaná část apriorní pravděpodobnosti (spočtené jako integrál z hustoty) – např. 95% nebo 97,5% – soustředila v intervalu mezi minimem a maximem. Vzhledem k tomu, že malá část pravděpodobnosti zůstává vyhrazena pro odhady starší než maximum, je takto stanovená horní hranice "měkká" (soft upper bound) (Yang & Rannala 2006). Díky populárním softwarovým balíčkům MCMCtree a především BEAST apriorní hustoty a měkké horní hranice rychle nahradily dřívější metody, a to i v ptačí fylogenetice (např. Brown et al. 2008).
3. Problémy s kalibracemi...
Brzy se ale i tento postup ukázal být problematickým. Hlavní problém asi nejlépe popsal Joseph Brown:
Výhrady navíc přicházely i z jiných stran. Heled & Drummond (2012) upozornili, že kalibrační hustota, kterou uživatel BEASTu specifikuje, neodpovídá skutečnému – marginálnímu či "indukovanému" – apriornímu rozdělení pro stáří uzlů. Pokud navrhneme konkrétní hodnotu pro stáří určitého kalibrovaného uzlu, BEAST pro ni spočítá indukovanou apriorní hustotu tak, že vynásobí kalibrační hustotu hustotou, kterou tomuto stáří pro daný uzel přiřazuje použitý model speciace. Přestože se indukované apriorní rozdělení může od kalibrační hustoty drasticky lišit, autorům analýzy zůstává víceméně skryto. Jediný způsob, jak zjistit jeho tvar, je nechat analýzu běžet s prázdnou datovou maticí, což ji nutí samplovat přímo z apriorního rozdělení. Ještě závažnější je, že tato "multiplikativní konstrukce" porušuje pravidla pravděpodobnostního počtu. Pokud dva jevy nejsou vzájemně nezávislé, pravděpodobnost jejich společného výskytu nelze spočítat prostým součinem, a je přinejmenším zvláštní předpokládat, že fosilní data jsou nezávislá na procesu, který generuje časy uzlů. Heled a Drummond proto navrhli využívat "podmíněnou konstrukci", ve které je marginální apriorní rozdělení shodné s kalibrační hustotou a model speciace se kalibracím přizpůsobuje (= je jimi podmíněn):
\begin{align}
f_C\left( t, \tau \,\middle\vert\, \Theta \right) & = f\left( t, \tau \,\middle\vert\, \Theta \right) f\left(t_C\right) & \mbox{multiplikativní konstrukce}\\
f_C\left( t, \tau \,\middle\vert\, \Theta \right) & = f\left( t_{NC}, \tau \,\middle\vert\, \Theta \right) f\left(t_C\right) & \mbox{podmíněná konstrukce}
\end{align}
kde $f_C(\cdot)$ je kalibrované marginální apriorní rozdělení, $t_C$ je stáří kalibrovaného uzlu, $t_{NC}$ je stáří nekalibrovaných uzlů a zbytek symbolů odpovídá rovnici (1). (Podle Heled & Drummond 2013.)
Srovnání podmíněné a multiplikativní konstrukce na dříve publikovaném datasetu odhalilo až trojnásobné rozdíly v aposteriorních odhadech (Heled & Drummond 2012). Úspěch byl zpočátku jen částečný, protože autoři dokázali podmíněnou konstrukci aplikovat jen na Yuleův proces s jedinou kalibrací. O rok později Heled & Drummond (2013) rozšířili stejný postup i na proces množení a zániku s libovolným počtem kalibrací, ukázalo se však, že pro takto zobecněný problém neexistují řešení v uzavřeném tvaru a je nutno přejít k výpočetně mimořádně náročnému numerickému řešení.
Ani podmíněná konstrukce navíc nedokáže vždy zabezpečit, aby uživatelem zadaná hustota odpovídala marginálnímu apriornímu rozdělení. Je-li jeden uzel vnořen do druhého, jsou jejich stáří evidentně vzájemně závislá – musí vyhovovat biologické podmínce, aby každý uzel byl mladší než jeho předci a starší než jeho potomci (Warnock et al. 2012; Heled & Drummond 2013; Heath & Moore 2014). Pokud jsou oba uzly kalibrovány a jejich kalibrační hustoty se překrývají (což nastane téměř vždy, protože všechny hustoty s výjimkou té uniformní mají tenký ocásek nízké pravděpodobnosti táhnoucí se do nekonečna), analýza je prostě ořízne. Marginální (skutečná) apriorní pravděpodobnost tedy bude ve výsledku opět odlišná od té zadané.
4. ... a co s nimi dělat
V době publikování těchto studií už ale byla ale v plném proudu celá řada nezávislých pokusů, jak učinit bayesovské datování rigoróznějším. Nejkonzervativnější byli zřejmě Parham et al. (2012), kteří k problému přistoupili z čistě paleontologického hlediska a představili detailní protokol pro stanovování tvrdých minim a měkkých maxim, ilustrovaný na příkladu divergence mezi ptáky a krokodýly. K tomu nejdůležitějšímu – jaký průběh by měla mít křivka apriorní hustoty mezi minimem a maximem – se ale vyjádřili jen krátce v sekci "Future Directions", kde podpořili návrhy využít masivní databáze k odhadu faktorů zkreslujících pravděpodobnost dochování fosilií. O něco dál zašli Dornburg et al. (2011) při pokusu vzít v úvahu "Sppil-Rongisův" efekt*, podle kterého pravděpodobnost dochování ve fosilním záznamu roste s klesajícím stářím. Díky tomuto jevu můžeme očekávat, že většina kandidátů na fosilní kalibrace bude příliš mladá, než aby poskytla věrohodný odhad stáří divergence; budou to naopak ty fosilie, které svým vysokým stářím mezi ostatní nezapadají, které budou pro analýzu nejcennější. Dornburg a spol. se proto zaměřili na identifikaci a vyřazení nekonzistentních, příliš mladých fosilií.
*"Sppil-Rongisův" efekt je hříčkou na Signor-Lippsův efekt, který popisuje přesně opačnou situaci (a je pojmenován po skutečných lidech).
Heath (2012) posunula celý problém o úroveň výš. Místo toho, aby hodnoty hyperparametrů stanovila arbitrárně, navrhla použít hierarchický bayesovský model, který je tahá z nového apriorního rozdělení (hyperprioru). Odhad stáří divergence potom bere v úvahu všechny hodnoty, kterých hyperparametry mohou nabývat, a to v poměru k jejich pravděpodobnosti (specifikované hyperpriorem). Analýza tedy hyperparametry marginalizuje – "vyintegruje". Jak ale sama autorka konstatovala v souvislosti s jinou aplikací hyperpriorů (Heath & Moore 2014), tento postup problém spíš jen odsouvá než řeší. Nemá-li se fylogenetik uchýlit k nekonečnému regresu, v nějakém bodě to prostě musí risknout, napevno stanovit hodnotu parametru vyššího řádu a doufat, že analýza bude na její volbu méně citlivá, než je tomu na nižších úrovních.
Wilkinson et al. (2011) poukázali na to, že dosavadní způsob navrhování apriorních rozdělení odvrhuje všechny informace, které fosilní záznam poskytuje, s jedinou výjimkou tvrdého minima. Aby této ztrátě dat zabránili, použili autoři proces množení a zániku jako model speciace a dva modely samplingu, popisující pravděpodobnost nalezení fosilií. Parametry obou modelů (včetně mezery mezi datem divergence a nejstarší známou fosilií) jsou odhadnuty z databáze zachycující počty druhů fosilních primátů v různých geologických epochách. Odhad je přitom mimořádně obtížný, protože není znám tvar věrohodnostní funkce, která udává pravděpodobnost pozorovaných dat v závislosti na hodnotách parametrů. Řešením je provést simulaci, která vytáhne určité hodnoty parametrů, nasimuluje podle nich celou historii primátů (včetně topologie fylogenetického stromu a počtu fosilních nálezů) a v závislosti na detailech této historie si ony hodnoty buď ponechá, nebo je odmítne (např. tehdy, pokud je kořen stromu mladší než nejstarší fosilie, pokud simulace nechala vymřít jednu z větví, která ve skutečnosti přežila do současnosti, nebo pokud odhadované počty fosilních nálezů příliš hrubě nesedí na skutečný fosilní záznam). Tato metoda však nejenže nevzorkuje z pravého aposteriorního rozdělení (jen z rozdělení, které jej aproximuje), ale je navíc příliš časově náročná. Wilkinson et al. (2011) ji tedy nahradili jiným přibližným postupem, využívajícím složitou kombinaci nejrůznějších bayesovských algoritmů. Poměrně vágní výsledná rozdělení pak už využili jako klasické kalibrační hustoty pro analýzu sekvenčních dat.
5. Konec kalibrací: tip-dating
Nejradikálnějším řešením by bylo kalibrační hustoty úplně vypustit a fosilie do analýzy zahrnout jako plnohodnotné koncové taxony neboli špičky (tips). Výhodu by to mělo ještě v jednom ohledu: kromě všech výše zmíněných problémů (subjektivita, nejasné interakce mezi kalibracemi navzájem i s jinými priory, omezené využití dostupného fosilního záznamu) musejí být fosilní kalibrace navíc napevno přiřazeny k určitému uzlu. Pokud ale chceme provést sdružený odhad topologie a stáří uzlů, měli bychom existenci jakéhokoli uzlu testovat, nikoli předpokládat. Pokud např. použijeme vegavise ke kalibraci divergence mezi kachnovitými (Anatidae) a husovcem (Anseranas), implicitně si tím vynucujeme monofylii kladu (husovec + kachnovití). To může vést k přehnané podpoře pro kalibrované uzly či odhady jejich stáří (Ronquist et al. 2012). Výjimkou je v tomto směru BEAST, který umí fosilní kalibraci přiřadit poslednímu společnému předkovi zadaných taxonů bez ohledu na to, jak obsáhlý je klad, který tímto předkem vzniká. Monofylii žádných uzlů si tedy nevynucuje. I v BEASTu ale platí, že fosilie nemají volnost zapadnout do libovolných míst stromu. Jejich příbuzenství s žijícími taxony je napevno nastaveno před analýzou, nikoli odhadováno coby její součást, a v praxi je přitom často nastaveno špatně. Do jisté míry je vina na straně molekulárních biologů, kteří nejsou dostatečně obeznámeni s paleontologickou literaturou a řídí se zastaralými údaji, protože si nevšimli nových interpretací kalibračních fosilií; do jisté míry jde o prostý důsledek faktu, že většina relevantních fosilií nebyla nikdy podrobena fylogenetické analýze. Např. u ptáků jsou špatně identifikované fosilie pro datovací analýzy chronickým problémem (Mayr 2005, 2013; Ksepka 2009).
Už nějakou dobu jsou přitom k dispozici modely evoluce pro morfologické znaky, které umožňují provést společnou (total-evidence) bayesovskou analýzu molekulárních a morfologických dat (Lewis 2001; Nylander et al. 2004). Mezi prvními, kteří se je pokusili využít k odhadu fylogenetické pozice kalibračních fosilií, byli Lee et al. (2009), jejichž postup byl celkově velmi neobvyklý. Autoři provedli klasickou (bezčasovou) analýzu kombinovaného morfologicko-molekulárního datasetu zahrnujícího kalibrační fosilii. Pro každý z 1000 nasbíraných stromů – bez ohledu na to, kde na něm fosilie stála – pak provedli oddělenou datovací analýzu semiparametrickým uhlazováním tempa evoluce. Nakonec sestrojili konsenzovou topologii, přičemž konfidenční intervaly pro stáří jejích uzlů spočítali přes všechny topologie. (Pokud např. poslední společný předek A a B byl na jednom stromě také předkem C, D a E a na druhém stromě ne, jeho stáří na konsenzovém stromě bylo zprůměrováno přes obě možnosti.) Lee a spol. tedy sice učinili výrazný pokrok tím, že vzali v úvahu nejistotu o fylogenetické pozici kalibrační fosilie, ale neprovedli skutečný sdružený odhad topologie a datace. Stromy, které získali, nebyly kalibrované a musely být datovány v odděleném, druhém kroku analýzy. Důvod, proč Lee a spol. zvolili tuto nepříliš spolehlivou kombinaci metod místo BEASTu, byl poměrně prozaický: BEAST v té době ještě neuměl analyzovat morfologické znaky.
Daleko více se ideálu přiblížil Pyron (2011), který využil faktu, že BEAST naopak už poměrně dlouho umožňoval kalibrovat strom nejen přiřazením fosilií k jeho uzlům, ale také zahrnutím špiček různého stáří. Drummond et al. (2006) tento typ kalibrace předvedli na příkladu virových sekvencí samplovaných v průběhu 17 let, nic ale nebrání aplikaci stejného principu na fosilie staré desítky či stovky milionů let. Od doby, co svou práci publikovali Lee a spol., byl už BEAST navíc doplněn o modely morfologické evoluce, a sdruženému total-evidence odhadu fylogeneze a stáří tedy už nic nestálo v cestě. Pyron použil 41 fosilií, z nichž pouhé 3 však spadaly do ingroup, tj. skupiny zájmu. Provedl dvě analýzy, z nichž v jedné byl model rychlostí evoluce (nekorelovaný lognormální) společný pro molekulární i morfologické znaky, zatímco v druhé obě sady dat obdržely samostatné modely. Autor nesdělil, jaký model speciace použil, což je znepokojivé, protože většina dostupných modelů se pro stromy s různě starými špičkami vůbec nehodí (viz níže).
Ronquist et al. (2012) k problému přistoupili důkladněji a zkompilovali rozsáhlý dataset žijících i fosilních blanokřídlých s velkým překryvem mezi morfologií a molekulami (téměř všechny žijící taxony byly samplovány na oba typy dat), kde se většina fosilií soustředila v rámci ingroup. Na rozdíl od Pyrona věnovali velkou pozornost výběru modelu speciace. Yuleův proces, který předpokládá nulové tempo vymírání, je evidentně nevhodný – pokud není každá analyzovaná fosilie předkem jiného taxonu, budou jeho předpoklady silně narušeny (Heath & Moore 2014). Proces množení a zániku je realističtější a byl rozšířen i na případy, kdy jsou špičky stromu samplovány z více než jednoho časového horizontu (Stadler 2010; Stadler & Yang 2013), je ale velmi citlivý na velikost a výběr vzorku. Z koalescenčního procesu lze spočíst pravděpodobnostní hustotu pro stromy se špičkami o různém stáří celkem jednoduše, Ronquist a spol. jej však zamítli s tím, že se hodí více pro genové stromy než druhové stromy odhadované z kombinovaných dat. Místo toho se rozhodli zobecnit uniformní apriorní rozdělení pro datované topologie na stromy s různě starými špičkami. Ve výsledném modelu speciace jsou stáří uzlů tahána z uniformních rozdělení s maximem ve stáří kořene a minimem ve stáří špičky. Strom se sestrojí tak, že v každém vnitřním uzlu, od nejmladšího po ten nejstarší, necháme splynout dvě náhodně vybrané linie existující v daném čase. S tímto modelem Ronquist et al. (2012) provedli celou řadu analýz. Jejich úplný přehled poskytuje flowchart přetištěný níže; stručné shrnutí postupu nabízím pod ním:
Co se topologie týče, nejlepší výsledky podala bezčasová analýza. Striktní molekulární hodiny odkryly bizarní topologii, ve které hmyz s dokonalou proměnou (Holometabola) netvořil monofyletickou skupinu; ani vynucení jeho monofylie ale zbytek stromu "nespravilo". Stromy založené na relaxovaných hodinách byly obdobně nedůvěryhodné (v topologii vzešlé z IGR, kterou autoři přetiskli, už nebyla monofyletická ani ingroup, tj. blanokřídlí; jedna její část měla blíž k taxonům s nedokonalou proměnou), ale po vynucení monofylie Holometabola se vrátily k normálu. Ronquist et al. (2012) proto doporučují nadále používat k zakořeňování stromů outgroup – dokonce i v analýzách s relaxovanými hodinami, které ji technicky vzato nepotřebují. Srovnání relaxovaných hodin na základě Bayesova faktoru při použití fosilních kalibrací favorizovalo autokorelované modely (TK02 a CPP), což není překvapivé, protože přítomnost slabé autokorelace v rychlostech evoluce už předtím potvrdil přídavný rozbor. Použití fosilií jako špiček ale pořadí modelů prudce změnilo: TK02 se propadl, IGR se vyrovnal CPP nebo ho dokonce překonal. Výsledky z IGR také údajně lépe sedí na fosilní záznam, protože nevyžaduje tak dlouhé mezery bez známých fosilií (ghost lineages). (Nejsem si jistý, zda tohle autorům věřit. IGR obecně odkrývá staré korunní klady a krátké kmenové linie, což by mělo ghost lineages spíš prodlužovat.)
Nejzajímavější jsou ale rozdíly mezi klasickým datováním pomocí kalibrací a tip-datingem. Je dobré uvést, že ani analýza s fosilními špičkami nebyla zcela prosta kalibrací (stejně jako u Pyrona). Ronquist a spol. kalibrovali kořen stromu, jak vyžadoval jejich uniformní model speciace, a kořen Holometabola, kde by odstranění kalibrace vyžadovalo zahrnutí řady dalších fosilií pro outgroup. Hraní si se střední hodnotou příslušných kalibračních hustot (ekvivalentní tomu, co dělali Warnock et al. 2012) ale ukázalo, že tip-dating analýza je na kalibrace méně citlivá než klasický postup. Rozdílné byly i výsledky: datování pomocí špiček odkrylo mladší data pro uzly mimo blanokřídlé a dva uzly uvnitř blanokřídlých, všude jinde byla naopak výsledná stáří vyšší než za použití kalibrací. Tip-dating byl také přesnější, což se projevilo užšími 95% intervaly nejvyšší aposteriorní hustoty. Snad nejvíc se ale výhody této metody projevily ve výsledné fylogenetické pozici zahrnutých fosilií. Ta byla v mnoha případech extrémně nejistá a aposteriorní pravděpodobnost i toho nejlepšího odhadu občas nepřesáhla 0,3. Ze sedmi fosilií, které byly přiřazeny ke konkrétním uzlům v analýzách s kalibracemi, jen tři zaujaly stejnou pozici v total-evidence analýze s aposteriorní pravděpodobností vyšší než 0,5. Ve dvou případech dokonce aposteriorní pravděpodobnost pozice, která byla předpokládána pro analýzu s kalibracemi, činila přesně 0.
Autoři se také věnovali otázce, zda morfologickým a molekulárním datům dát oddělené modely rychlostí evoluce, nebo použít jediný model společný. Zvolili druhou možnost, a to ze dvou důvodů. První z nich byl pragmatický: významný nárůst v počtu parametrů (rychlostí) by mohl zkomplikovat konvergenci MCMC a hrozí, že výsledný model by byl přeparametrizovaný. Druhým důvodem je, že délky větví na bezčasových stromech založených na morfologii a na molekulách spolu jasně korelují (tzn., že větve, které jsou dlouhé na jednom stromě, jsou dlouhé i na druhém). Ronquist a spol. ale zdůrazňují, že i oddělené modelování stojí za další výzkum.
V závěru autoři konstatují, že tip-dating by měl být upřednostněn před klasickým přístupem založeným na kalibracích kdekoli, kde je to jen možné. Informace z fosilií začleňuje přímo a nespoléhá na druhotné interpretace, které mohou být chybné. Podává rovněž přesnější výsledky, což ukazuje, že s fosiliemi pracuje efektivněji. V neposlední řadě má používání fosilií coby špiček motivovat autory, aby se zaměřili na dosud spíše přehlížené aspekty datování – studium fosilií a jejich morfologických znaků, modelování morfologické evoluce a vývoj sofistikovanějších modelů speciace.
6. Reakce a kritika
Celkové přijetí postupů Pyrona (2011) a Ronquista a spol. (2012) se zdá být poměrně entuziastické. Vzhledem k tomu, že tip-dating je nyní dostupný v obou velkých softwarových balíčcích pro bayesovskou fylogenetiku (MrBayes 3.2 a BEAST), studií využívajících této metody rychle přibývá: Lee et al. (2013); Slater (2013); Wood et al. (2013); Near et al. (2014); Tseng et al. (2014). Líbí se mi, že hned dvě práce z tohoto stále dosti úzkého okruhu se zabývaly fosilními pan-aviany – o těch budu psát v příštích dvou dílech této série. Ne vždy se ale tento přístup ukázal být spolehlivým. Vilhelmsen & Zimmermann (2014), kteří se pokusili k datování využít výhradně morfologické znaky, zaznamenali, že pro některé uzly činil rozptyl odhadovaných stáří přes 300 milionů let – jak sami konstatují, zřejmě proto, že jejich analýza obsahovala příliš málo fosilií v poměru k žijícím taxonům. Lee et al. (2013) zjistili, že zatímco tip-dating v BEASTu pro jejich dataset funguje bezproblémově, MrBayes měl v kombinaci s modelem IGR potíže s konvergencí, a pokud zkonvergoval, pak na naprosto bizarních stromech. Vysoce nespolehlivé byly i odhady rychlostí evoluce, které v některých případech kolísaly o šílených osm řádů.
Dostupnost tip-datingu také nutí autory, aby explicitně odůvodnili další užívání kalibrací. Příkladem je např. nedávná studie o původu pěvců (Ericson et al. 2014; na blogu krátce zde), na které se podílela i jedna ze spoluautorek Ronquista a spol. (2012) a která použila stejný zobecněný uniformní model speciace – avšak pro tradiční analýzu s kalibračními hustotami. Autoři přiznali, že přímé zahrnutí fosilií představuje lepší postup, konstatovali však, že rozsáhlé datasety s velkým počtem morfologických znaků kódovaných pro žijící i fosilní taxony nejsou pro většinu skupin dostupné. Podobně argumentovaly i jiné studie.
Některé práce zašly dál a nabídly kritický pohled na tip-dating. Heath & Moore (2014) označují za možný problém této techniky chybějící data. Pro tip-dating jsou potřeba datové matice, které kombinují morfologické a molekulární znaky. Vzhledem k tomu, že od fosilií téměř nikdy žádná molekulární data nemáme (i ze subfosilních taxonů typu sloních ptáků je velmi těžké vytáhnout aspoň kompletní mitochondriální genom), jsou tyto matice plné nenáhodně rozložených chybějících dat. To sice nemusí nutně zkreslit topologii, může to ale zasáhnout délky větví (a tím pádem i stáří uzlů). Je ale fér uvést, že jak Pyron (2011), tak i Ronquist et al. (2012) se pokusili tento problém adresovat. První jmenovaný hledal korelaci mezi délkou větve a množstvím dat známým od taxonu na jejím konci; žádné zkreslení odhadů stáří ale neodhalil. Ronquist a spol. vycházeli z předpokladu, že pokud nekompletnost fosilií zkresluje délky větví, ty nejméně kompletní by je měly zkreslovat nejvíce. Vyřazení fosilií, které byly kódovány pro méně než 10% morfologických znaků, ale vyprodukovalo téměř shodné mediány stáří uzlů, jaké odhalila kompletní analýza. Autoři proto usoudili, že informace, které fosilie poskytují, přebíjejí problémy plynoucí z jejich nekompletnosti.
Heath & Moore (2014) také uvádějí, že není jisté, do jaké míry lze evoluci morfologických znaků popsat (relaxovanými) hodinami. Přijímají sice argumenty Ronquista a spol., podle kterých je určitá korelace mezi morfologickou odlišností dvou taxonů a dobou uplynulou od jejich divergence nevyhnutelným důsledkem evoluce, namítají ale, že morfologické hodiny mohou "tikat" jiným tempem než ty molekulární. Pyronův postup, ve kterém jsou morfologickým a molekulárním datům přiděleny samostatné modely rychlostí evoluce, sice tento problém zdánlivě řeší, viz ale poznámku výše o přeparametrizaci a obtížné konvergenci. Zdá se tedy, že ideální je řídit se protokolem Ronquista a spol., analyzovat nejprve oba typy dat odděleně a porovnat, jak spolu korelují výsledné délky větví či stáří uzlů. Heath a Moore dále argumentují, že selekční tlaky, kterým morfologie podléhá, mohou způsobovat heterotachii – jev, kdy se rychlosti evoluce liší jak mezi znaky, tak napříč stromem.* Pak by byl předpoklad, že jediné hodiny platí pro všechny morfologické znaky, zjevně chybný. Možným protiopatřením (dodávám já) by bylo rozdělit morfologický dataset na několik oddílů, např. podle Bayesova faktoru – jak to udělali Clarke & Middleton (2008) ve své bezčasové bayesovské analýze ptačí morfologické evoluce – a každému přidělit samostatný model rychlostí evoluce; zde ale opět vyvstává riziko přeparametrizace.
*Heterotachie nesmí být zaměňována za prosté rozdíly v rychlosti evoluce napříč znaky (rates-across-sites heterogeneity, RAS). Existující modely morfologické evoluce adresují RAS a u každého znaku sčítají přes několik rychlostních kategorií, stále ale předpokládají, že poměr délek větví zůstává v každé kategorii konstantní. Pokud tedy znak 1 prodělá na větvi A 0,03 substitucí a znak 2 0,05 substitucí, na třikrát delší větvi B musí znak 1 prodělat 0,09 substitucí a znak 2 0,15 substitucí. Pokud ale evoluce podléhá heterotachii, počet substitucí na větvi B může činit 0,09 pro znak 1 a např. 0,02 pro znak 2. Chceme-li se s heterotachií vypořádat při modelování evoluce, musíme pro oba znaky specifikovat jinou sadu délek větví. Krátce jsem o tom na blogu psal zde.
Poslední kritika Heathové a Moore'a se týká nedostatku modelů speciace vhodných pro tip-dating. Zobecněný uniformní model Ronquista a spol. podle autorů není biologicky smysluplným popisem procesů, které generují strom (Heath & Moore 2014: 315). Takový popis by měl zahrnovat jak diverzifikaci, tak i uchovávání fosilií a jejich sampling. První pokroky v tomto směru už ale byly učiněny (viz níže)
Tip-dating byl diskutován i z čistě paleontologického hlediska. Prvním v tomto směru byl zřejmě Laurin (2012), jehož kritika ale byla dost neinformovaná. Podle něj datování s fosilními špičkami vyžaduje, aby byly na morfologickou evoluci aplikovány modely původně vyvinuté pro molekulární data. Větší složitost morfologických znaků má přitom snižovat pravděpodobnost, že jednoduchý model bude pro jejich evoluci adekvátním popisem. (Častý omyl: model je vždy zjednodušený, nikdy nemá jít o detailní a realistický popis modelovaného systému.) Za největší překážku Laurin považuje fakt, že zatímco modely evoluce vyžadují nezkreslený vzorek všech znaků, skoro všechny existující morfologické datasety zahrnují jen znaky informativní pro parsimonii (čili znaky, kde je každý stav přítomen minimálně u dvou taxonů). Už dlouho je ale dostupný model, který takto zkreslený výběr znaků dokáže korigovat (Nylander et al. 2004), ačkoli zatím jen v programu MrBayes. Jeho statistické vlastnosti detailně analyzovali Allman et al. (2010), kteří dokázali, že s 8 a více taxony jsou jeho parametry identifikovatelné, a poskytuje tedy statisticky konzistentní odhad fylogeneze. Laurin dále argumentuje, že tip-dating může být poněkud nepraktický kvůli nedostatku velkých morfologických datasetů, přesto ale uznává jeho potenciál (Laurin 2012: 13).
Pro paleontology je tip-dating obzvlášť zajímavý v souvislosti s rostoucím zájmem o evoluci znaků. Jak konstatuje Bapst (2014), v poslední době začali paleontologové přebírat neontologické metody (vyvinuté pro molekulární fylogeneze se stejně starými špičkami) k výzkumu takových otázek, jako "Proběhla v nějaké skupině nebo časovém intervalu změna relativní rychlosti evoluce určitého znaku?" nebo "Jaký je vztah mezi znaky, či mezi znakem a určitým faktorem prostředí?". Tyto metody ale vyžadují datované stromy, které parsimonie – v paleontologii nejpoužívanější fylogenetická metoda – nedokáže poskytnout. Simultánní odhad topologie a stáří uzlů pro fosilní taxony by byl ideální, a řada paleontologů do něj proto vkládá velké naděje (Bapst 2013, 2014; Slater & Harmon 2013). I zde se ale objevují určité výhrady. Tou nejčastější je, že dostupné implementace tip-datingu neberou v úvahu procesy, které ovlivňují výběr použitého vzorku taxonů – především frekvenci uchovávání a nalézání fosilií. Zpřesnění by mohly přinést modely, ve kterých jsou tempa fosilizace tahána z určitého pravděpodobnostního rozdělení, se samostatným rozdělením pro každou biogeografickou oblast (Slater & Harmon 2013). Bapst (2013) také podotýká, že existující bayesovské metody nedokážou pracovat se vztahy typu předek-potomek, což může při nakládání s fosilním záznamem představovat problém. Pennell & Harmon (2013) se rovněž vracejí k problému nenáhodně rozložených chybějících dat, považují jej ale spíš za riziko pro následovné analýzy znakové evoluce než pro tip-dating samotný.
7. Kde jsme teď
Jak již bylo řečeno, tip-dating byl přijat s entuziazmem a rychle se rozšiřuje. Tento trend bude téměř jistě pokračovat: podle Bapsta (2014) nejenže mají bayesovské analýzy s fosilními špičkami šanci stát se převládající metodou pro tvorbu datovaných paleontologických stromů, ale mohou se stát sjednocujícím přístupem aplikovatelným na širokou škálu datasetů, pro které zatím potřebujeme řadu různých ad hoc metod.
Do budoucna lze bezesporu očekávat další zlepšování metod navržených Pyronem (2011) a Ronquistem a spol. (2012). Ukázku takového zlepšení nedávno nabídli Heath et al. (2014), kteří vyvinuli nový model speciace, nazvaný "fosilizovaný proces množení a zániku" (Fossilized Birth-Death Process, FBD). Ten vůbec poprvé předpokládá, že fosilie jsou produktem stejného větvícího procesu, který generuje zbytek stromu. Přestože model předpokládá konstantní tempo speciace, vymírání a fosilizace, detailní simulace ukázaly, že je vůči narušení těchto předpokladů velmi robustní: ani zkreslený výběr fosilií, ani zkreslený výběr žijících taxonů nemá na výsledné odhady stáří vliv; a pokud se zajímáme jen o stáří uzlů a nikoli o celou komplexní makroevoluční dynamiku, lze tempa speciace, vymírání a fosilizace vyintegrovat jako náhodné proměnné. FBD je navíc použitelný jak pro tip-dating, tak i pro klasické analýzy založené na kalibracích, ze kterých ale odstraňuje nutnost používat kalibrační hustoty. Místo toho poskytuje sjednocené apriorní rozdělení pro kalibrované i nekalibrované uzly, a dokonce umožňuje vzít v úvahu i nejistotu ohledně fylogenetické pozice fosilií.
8. Acknowledgments
Děkuji Tracy Heathové za to, že mi poslala kopii své vynikající práce shrnující dostupné metody bayesovského datování, a Davidu Bapstovi za přístup k řadě dalších studií citovaných v tomto článku, včetně jeho vlastních prací.
Zdroje:
Prostřední pozici mezi oběma extrémy, tj. předpokladem totální nezávislosti délek větví na jedné straně a striktními molekulárními hodinami na straně druhé, se podařilo najít až na konci 90. let v tzv. relaxovaných hodinách (relaxed-clock models). Spolu s tím se otevřel prostor pro robustnější datovací metody. Většina datovacích analýz využívajících relaxované hodiny je prováděna v bayesovském frameworku a zahrnuje tři klíčové složky (podseznamy nejsou zamýšleny jako vyčerpávající):
- parametrické apriorní rozdělení (model*) rychlostí evoluce, které může mít několik různých forem (viz Brown & van Tuinen 2011; Heath & Moore 2014):
- lokální molekulární hodiny
- autokorelované rychlosti
- exponenciálně distribuované nekorelované rychlosti
- lognormálně distribuované nekorelované rychlosti
- směsi rychlostí
- parametrické apriorní rozdělení pro topologie a zároveň stáří jejich uzlů ("tree prior", přesněji time-tree prior nebo tree process prior [Heled & Drummond 2013], česky snad "model speciace"):
- Yuleův proces (čisté množení; pure birth)
- proces množení a zániku (birth-death process)
- koalescenční proces
- parametrická kalibrační hustota pravděpodobnosti ("calibration prior", přesněji calibration density – viz Heled & Drummond 2012):
- uniformní
- normální (Gaussova)
- exponenciální
- lognormální
V bezčasové analýze (vlevo) je délka každé větvě úměrná součinu jejího tempa evoluce a trvání v čase. Relaxované hodiny umožňují oba činitele oddělit a odhadovat rychlost evoluce (uprostřed) i stáří uzlů (vpravo) zvlášť. Přepočítat stáří uzlů na absolutní čas umožňují fosilní kalibrace, znázorněné červenými trojúhelníky. (Zdroj: treethinkers.org, kredit: Tracy Heath)
K analýze je možné přidávat i další prvky (lze si např. vynutit monofylii některých uzlů), tyto tři jsou však nutným základem. Abychom odlišili, jak se na celkovém množství změn (= délce větve) podílí rychlost a jak čas, musíme učinit určité předpoklady o tom, jak se rychlost evoluce mění napříč stromem (1). Pokud tento model rychlostí (1) zkombinujeme s modelem pro časy uzlů (2), znovu se dostáváme tam, kde jsme byli u striktních molekulárních hodin. Délka větve je přímo úměrná jejímu stáří, a jde tedy o odhad relativního času divergence. Konstantu úměrnosti, která relativní stáří převede na stáří absolutní, dodá jedna nebo více fosilních kalibrací (3). Přesný tvar každého z těchto tří apriorních rozdělení popisují hyperparametry**. Jedna sada hyperparametrů určuje např. tvar rozdělení, ze kterého taháme rychlosti pro jednotlivé větve stromu (1). Další potřebujeme pro model speciace (2): Yuleův proces je popsán jedním hyperparametrem, proces množení a zániku dvěma. Konečně i tvar kalibračních hustot (3) je nutné stanovit touto formou. Provádíme-li sdružený odhad topologie a stáří jejich uzlů, jak je běžné v dnešních analýzách, lze podle Bayesovy věty celý proces zapsat jako
\begin{equation}
f\left( \tau, t, r, \Theta, \Phi, \Omega \,\middle\vert\, \boldsymbol{X} \right) = \frac{f(\tau \,\vert\, \Theta) f(t \,\vert\, \Theta) f(r \,\vert\, \Phi) f(\Theta) f(\Phi) f(\Omega) f(\boldsymbol{X} \,\vert\, \tau, t, r, \Omega)}{f(\boldsymbol{X})} \\
\end{equation}
kde $\tau$ je topologie fylogenetického stromu, $t$ je vektor (uspořádaná n-tice náhodných veličin) stáří uzlů, $r$ je vektor rychlostí evoluce, $\Theta$ je vektor obsahující hyperparametry modelu speciace, $\Phi$ je vektor obsahující hyperparametry modelu rychlosti evoluce, $\Omega$ je vektor obsahující parametry modelu molekulární evoluce a $\boldsymbol{X}$ jsou sekvenční data. (Podle Drummond et al. 2006, Heath & Moore 2014.)
*Ačkoli v bayesovské inferenci "apriorní pravděpodobnost" a "model" neznamenají totéž (apriorní pravděpodobnost je na modelu závislá: $\mathrm{Pr}(\theta) = \mathrm{Pr}(\theta \,\vert\, M)$), v tomto kontextu jsou oba pojmy používány jako vzájemně zaměnitelné – např. "birth-death prior" a "birth-death model".
**Apriorní rozdělení popisuje pravděpodobnost, jakou různým hodnotám parametru přiřazujeme předtím, než provedeme analýzu dat. Parametry, které popisují tvar apriorního rozdělení, jsou označovány jako hyperparametry, a apriorní rozdělení hyperparametrů se nazývá "hyperprior" (viz níže).
Z rovnice (1) je patrné, že zatímco pro model rychlostí i model speciace jsou hyperparametry odhadovány (analýza hledá jejich aposteriorní rozdělení), v případě kalibračních hustot tomu tak není. Jejich tvar musí být nastaven ještě před analýzou, a právě z této skutečnosti vyplývá celá řada problémů.
2. Kalibrační hustoty
Samo konstruování kalibračních hustot je přitom relativní novinkou. Ve starších datovacích analýzách bývalo stáří kalibrační fosilie přímo ztotožňováno se stářím divergence, což je zjevně neuspokojivé – kalibrační fosilie využívaná ke kalibraci je produktem divergence, kterou má datovat. Musí tedy být zákonitě o něco mladší, dokonce o tolik mladší, aby už disponovala morfologickými znaky charakteristickými pro jednu stranu této divergence. Skutečné stáří uzlu bude nejspíš o několik milionů let vyšší, než je stáří kalibrační fosilie, a díky neúplnosti fosilního záznamu vždy existuje i malá (ale nenulová) pravděpodobnost, že tento rozdíl bude ještě podstatně větší. Fosilní záznam tedy striktně vzato dovoluje pouze stanovení dolních hranic, čili minimálního stáří divergence. Máme-li fosilii 1, starou 50 milionů let, která spadá do kmenové linie taxonu A, víme, že divergence mezi A a jeho nejbližším žijícím příbuzným B musí být starší než 50 milionů let: stáří fosilie představuje tvrdou dolní hranici (hard lower bound) pro stáří divergence. Z principu ale nemůže existovat fosilie, jejíž stáří by nutně muselo být vyšší než stáří divergence. Pokud bychom např. objevili 60 milionů let starou fosilii 2, která by spadala do kmenové linie celého kladu A+B, pořád to neznamená, že divergence mezi A a B nemůže být stará např. 90 milionů let:
Fosilie z kmenové linie taxonu A (1) představuje tvrdou dolní hranici pro stáří společného předka A a B. Naproti tomu fosilie z kmenové linie celé skupiny A+B (2) neříká o stáří této skupiny nic a neumožňuje jej omezit shora: oba datované stromy jsou s pozicí a stářím fosilie 2 stejně kompatibilní. (Zdroj: vlastní ilustrace)
Z řad paleontologů přesto zaznívají argumenty, že někdy horní hranice stanovit lze. Příkladem může být situace, kdy má korunní klad celou řadou vymřelých příbuzných, jejichž stáří přibližně koresponduje s fylogenetickou pozicí (tj. čím bazálnější, tím starší):
Máme-li fosilií z kmenové linie kladu A+B více, věci jsou komplikovanější. Stáří fosilií 2, 3, 4 a 5 koreluje s jejich fylogenetickou pozicí. Na rozdíl od dolního stromu nám strom nahoře nedává žádný důvod takovou shodu očekávat, a proto je dolní strom lepším vysvětlením pozorovaných dat. V datovací analýze bychom to měli vzít v úvahu a stanovit horní hranici pro stáří kladu A+B, která odpovídá stáří fosilie 2. (Zdroj: vlastní ilustrace)
Obdobně by šlo argumentovat, že někdy je fosilní záznam natolik kompletní, že pokud v určitém období nějakou skupinu nenalézáme, jde o dostatečně silný důkaz, že ještě neexistovala. Tento argument je často zmiňován v kontroverzi o stáří moderních ptáků – z rané křídy, do které umisťují původ neornitů některé molekulárnědatovací studie, známe několik lokalit s velmi bohatou avifaunou (Yixian, Jiufotang), ve které ale není po moderních ptácích ani stopy. Marjanović & Laurin (2007) argumentovali, že pokud datovací analýza zahrnuje horní hranice, výsledné odhady jsou realističtější, zatímco výhradní užívání dolních hranic má tendenci stáří uzlů podhodnocovat.
Ačkoli tedy maxima mohou být užitečná, zůstává otázkou, jak je implementovat. Tvrdé horní hranice (hard upper bounds), analogické tvrdým dolním hranicím popsaným výše, jsou problematické hned z několika důvodů. Tím nejpodstatnějším je zřejmě fakt, že nemohou být "přehlasovány" žádným množstvím dat. Pokud se výše nastíněné úvahy o kompletnosti fosilního záznamu někde seknou a pravé datum divergence bude starší než tvrdé maximum, analýza jej nikdy neodhalí. Existuje ale i opačný problém: pokud budeme příliš opatrní a tvrdou dolní hranici posuneme příliš daleko do minulosti ve snaze vyhnout se předchozímu problému a nezamítat a priori ani málo pravděpodobná vysoká stáří, odhady budou vycházet nerealisticky staré (Yang & Rannala 2006).
Bayesovský přístup k fosilním kalibracím umožňuje tyto problémy elegantně obejít – nikoli však proto, že by šlo o naprostý převrat, jako spíš tím, že šikovně zobecňuje dřívější praxi. Autoři prosazující používání tvrdých maxim stanovili tvrdou dolní i horní hranici a výsledný odhad nechali spadnout kamkoli mezi ně čistě podle toho, co říkají data. Z bayesovského hlediska bychom to mohli vnímat tak, že (implicitně) stanovili uniformní apriorní rozdělení pro interval $(\min, \max)$. Není však důvod, proč by rozdělení muselo být uniformní. Naopak, výše uvedená fakta ukazují, že ideální by bylo zkonstruovat takové apriorní rozdělení, které nejvyšší pravděpodobnost přiřadí datům o pár milionů let starším, než je stáří kalibrační fosilie, a do hlubší minulosti nechá vyčnívat dlouhý "ocásek" nízké (ale ne nulové) pravděpodobnosti. Existují rozdělení, jejichž tvar přesně takovým požadavkům odpovídá – např. exponenciální nebo lognormální.
Různé kalibrační hustoty a hyperparametry, které určují jejich tvar, na obrázku z přednášky The Fossilized Birth-Death Process od Tracy Heathové. Uniformní rozdělení je určeno dolní a horní hranicí, lognormální rozdělení střední hodnotou a směrodatnou odchylkou, gama rozdělení tvarem a rozsahem, exponenciální rozdělení lambdou. (Zdroj: slideshare.net/trayc7, kredit: Tracy Heath)
Začlenit do tohoto frameworku horní hranice je již jednoduché: stačí si pohrát s hyperparametry (udávajícími přesný průběh funkce apriorní hustoty pravděpodobnosti) tak, aby se přesně specifikovaná část apriorní pravděpodobnosti (spočtené jako integrál z hustoty) – např. 95% nebo 97,5% – soustředila v intervalu mezi minimem a maximem. Vzhledem k tomu, že malá část pravděpodobnosti zůstává vyhrazena pro odhady starší než maximum, je takto stanovená horní hranice "měkká" (soft upper bound) (Yang & Rannala 2006). Díky populárním softwarovým balíčkům MCMCtree a především BEAST apriorní hustoty a měkké horní hranice rychle nahradily dřívější metody, a to i v ptačí fylogenetice (např. Brown et al. 2008).
3. Problémy s kalibracemi...
Brzy se ale i tento postup ukázal být problematickým. Hlavní problém asi nejlépe popsal Joseph Brown:
However, the same flexibility that makes these distributions so attractive unfortunately also makes them inherently subjective. Although rightly considered with enthusiasm [...], there is presently no rigorous protocol for determining the optimal shape [...] and breadth of these distributions, which makes direct comparisons across studies difficult.
Brown & van Tuinen 2011: 318
Nevertheless, at the moment construction of lognormal (and other) constraints is more of an art than a science; scientists would do best to investigate the sensitivity of divergence time inferences to changes in temporal prior constraints.
Brown & van Tuinen 2011: 319První studie popisující citlivost výsledných odhadů na tvar kalibračních hustot se začaly objevovat několik let zpátky a jejich výsledky byly všechno, jen ne povzbudivé. Clarke et al. (2011) a Warnock et al. (2012) ukázali, že i zdánlivě nevinná změna hodnot hyperparametrů – např. střední hodnoty ($\mu$) a směrodatné odchylky ($\sigma$) lognormálního rozdělení – může střední odhad stáří posunout až o několik stovek milionů let. To ukazuje, že – jak konstatují Heath & Moore (2014: 312) – kalibrační hustoty se chovají spíše jako "pseudodata" než jako klasické apriorní pravděpodobnosti, které jsou aktualizovány analyzovanými daty. Aposteriorní rozdělení časů divergence je vysoce citlivé na výběr a konkrétní nastavení kalibračních hustot a zpravidla jej těsně kopíruje.
Citlivost aposteriorních odhadů stáří na volbu hyperparametrů kalibrační hustoty. První dvě analýzy (1042 Ma BasalMax a 509 Ma BasalMax) využívají uniformní hustoty s různými maximy. Stanovení mladšího maxima snížilo stáří kořene stromu o více než 150 milionů let. Zbylé čtyři analýzy používají oříznuté Cauchyho rozdělení (truncated Cauchy distribution), které je výchozí volbou v programu MCMCtree. Autoři nastavili hyperparametr umístění (nejvyšší hodnotu rozdělení) tak, aby příslušné datum odpovídalo 110%, 125%, 150% a 175% stáří dolní hranice. Předěly mezi dvěma odstíny spojují navzájem si odpovídající uzly. (Zdroj: Clarke et al. 2011: Figure 8)
Výhrady navíc přicházely i z jiných stran. Heled & Drummond (2012) upozornili, že kalibrační hustota, kterou uživatel BEASTu specifikuje, neodpovídá skutečnému – marginálnímu či "indukovanému" – apriornímu rozdělení pro stáří uzlů. Pokud navrhneme konkrétní hodnotu pro stáří určitého kalibrovaného uzlu, BEAST pro ni spočítá indukovanou apriorní hustotu tak, že vynásobí kalibrační hustotu hustotou, kterou tomuto stáří pro daný uzel přiřazuje použitý model speciace. Přestože se indukované apriorní rozdělení může od kalibrační hustoty drasticky lišit, autorům analýzy zůstává víceméně skryto. Jediný způsob, jak zjistit jeho tvar, je nechat analýzu běžet s prázdnou datovou maticí, což ji nutí samplovat přímo z apriorního rozdělení. Ještě závažnější je, že tato "multiplikativní konstrukce" porušuje pravidla pravděpodobnostního počtu. Pokud dva jevy nejsou vzájemně nezávislé, pravděpodobnost jejich společného výskytu nelze spočítat prostým součinem, a je přinejmenším zvláštní předpokládat, že fosilní data jsou nezávislá na procesu, který generuje časy uzlů. Heled a Drummond proto navrhli využívat "podmíněnou konstrukci", ve které je marginální apriorní rozdělení shodné s kalibrační hustotou a model speciace se kalibracím přizpůsobuje (= je jimi podmíněn):
\begin{align}
f_C\left( t, \tau \,\middle\vert\, \Theta \right) & = f\left( t, \tau \,\middle\vert\, \Theta \right) f\left(t_C\right) & \mbox{multiplikativní konstrukce}\\
f_C\left( t, \tau \,\middle\vert\, \Theta \right) & = f\left( t_{NC}, \tau \,\middle\vert\, \Theta \right) f\left(t_C\right) & \mbox{podmíněná konstrukce}
\end{align}
kde $f_C(\cdot)$ je kalibrované marginální apriorní rozdělení, $t_C$ je stáří kalibrovaného uzlu, $t_{NC}$ je stáří nekalibrovaných uzlů a zbytek symbolů odpovídá rovnici (1). (Podle Heled & Drummond 2013.)
Srovnání podmíněné a multiplikativní konstrukce na dříve publikovaném datasetu odhalilo až trojnásobné rozdíly v aposteriorních odhadech (Heled & Drummond 2012). Úspěch byl zpočátku jen částečný, protože autoři dokázali podmíněnou konstrukci aplikovat jen na Yuleův proces s jedinou kalibrací. O rok později Heled & Drummond (2013) rozšířili stejný postup i na proces množení a zániku s libovolným počtem kalibrací, ukázalo se však, že pro takto zobecněný problém neexistují řešení v uzavřeném tvaru a je nutno přejít k výpočetně mimořádně náročnému numerickému řešení.
Ani podmíněná konstrukce navíc nedokáže vždy zabezpečit, aby uživatelem zadaná hustota odpovídala marginálnímu apriornímu rozdělení. Je-li jeden uzel vnořen do druhého, jsou jejich stáří evidentně vzájemně závislá – musí vyhovovat biologické podmínce, aby každý uzel byl mladší než jeho předci a starší než jeho potomci (Warnock et al. 2012; Heled & Drummond 2013; Heath & Moore 2014). Pokud jsou oba uzly kalibrovány a jejich kalibrační hustoty se překrývají (což nastane téměř vždy, protože všechny hustoty s výjimkou té uniformní mají tenký ocásek nízké pravděpodobnosti táhnoucí se do nekonečna), analýza je prostě ořízne. Marginální (skutečná) apriorní pravděpodobnost tedy bude ve výsledku opět odlišná od té zadané.
4. ... a co s nimi dělat
V době publikování těchto studií už ale byla ale v plném proudu celá řada nezávislých pokusů, jak učinit bayesovské datování rigoróznějším. Nejkonzervativnější byli zřejmě Parham et al. (2012), kteří k problému přistoupili z čistě paleontologického hlediska a představili detailní protokol pro stanovování tvrdých minim a měkkých maxim, ilustrovaný na příkladu divergence mezi ptáky a krokodýly. K tomu nejdůležitějšímu – jaký průběh by měla mít křivka apriorní hustoty mezi minimem a maximem – se ale vyjádřili jen krátce v sekci "Future Directions", kde podpořili návrhy využít masivní databáze k odhadu faktorů zkreslujících pravděpodobnost dochování fosilií. O něco dál zašli Dornburg et al. (2011) při pokusu vzít v úvahu "Sppil-Rongisův" efekt*, podle kterého pravděpodobnost dochování ve fosilním záznamu roste s klesajícím stářím. Díky tomuto jevu můžeme očekávat, že většina kandidátů na fosilní kalibrace bude příliš mladá, než aby poskytla věrohodný odhad stáří divergence; budou to naopak ty fosilie, které svým vysokým stářím mezi ostatní nezapadají, které budou pro analýzu nejcennější. Dornburg a spol. se proto zaměřili na identifikaci a vyřazení nekonzistentních, příliš mladých fosilií.
*"Sppil-Rongisův" efekt je hříčkou na Signor-Lippsův efekt, který popisuje přesně opačnou situaci (a je pojmenován po skutečných lidech).
Heath (2012) posunula celý problém o úroveň výš. Místo toho, aby hodnoty hyperparametrů stanovila arbitrárně, navrhla použít hierarchický bayesovský model, který je tahá z nového apriorního rozdělení (hyperprioru). Odhad stáří divergence potom bere v úvahu všechny hodnoty, kterých hyperparametry mohou nabývat, a to v poměru k jejich pravděpodobnosti (specifikované hyperpriorem). Analýza tedy hyperparametry marginalizuje – "vyintegruje". Jak ale sama autorka konstatovala v souvislosti s jinou aplikací hyperpriorů (Heath & Moore 2014), tento postup problém spíš jen odsouvá než řeší. Nemá-li se fylogenetik uchýlit k nekonečnému regresu, v nějakém bodě to prostě musí risknout, napevno stanovit hodnotu parametru vyššího řádu a doufat, že analýza bude na její volbu méně citlivá, než je tomu na nižších úrovních.
Princip hyperprioru. Parametr $\chi$ má lognormální apriorní hustotu (b), jejíž tvar určují hyperparametry $\mu$ (střední hodnota) a $\sigma$ (směrodatná odchylka). Pro stanovení druhého z nich použijeme hyperprior v podobě gama rozdělení (a), jehož tvar určují hyper-hyperparametry $s$ (tvar) a $\beta$ (rozsah). Integrací hustoty v (a) se lze vyhnout nutnosti udělit směrodatné odchylce arbitrární hodnotu, což ale stále musíme udělat o úroveň výše. (Zdroj: Heath 2012: Figure 2)
Wilkinson et al. (2011) poukázali na to, že dosavadní způsob navrhování apriorních rozdělení odvrhuje všechny informace, které fosilní záznam poskytuje, s jedinou výjimkou tvrdého minima. Aby této ztrátě dat zabránili, použili autoři proces množení a zániku jako model speciace a dva modely samplingu, popisující pravděpodobnost nalezení fosilií. Parametry obou modelů (včetně mezery mezi datem divergence a nejstarší známou fosilií) jsou odhadnuty z databáze zachycující počty druhů fosilních primátů v různých geologických epochách. Odhad je přitom mimořádně obtížný, protože není znám tvar věrohodnostní funkce, která udává pravděpodobnost pozorovaných dat v závislosti na hodnotách parametrů. Řešením je provést simulaci, která vytáhne určité hodnoty parametrů, nasimuluje podle nich celou historii primátů (včetně topologie fylogenetického stromu a počtu fosilních nálezů) a v závislosti na detailech této historie si ony hodnoty buď ponechá, nebo je odmítne (např. tehdy, pokud je kořen stromu mladší než nejstarší fosilie, pokud simulace nechala vymřít jednu z větví, která ve skutečnosti přežila do současnosti, nebo pokud odhadované počty fosilních nálezů příliš hrubě nesedí na skutečný fosilní záznam). Tato metoda však nejenže nevzorkuje z pravého aposteriorního rozdělení (jen z rozdělení, které jej aproximuje), ale je navíc příliš časově náročná. Wilkinson et al. (2011) ji tedy nahradili jiným přibližným postupem, využívajícím složitou kombinaci nejrůznějších bayesovských algoritmů. Poměrně vágní výsledná rozdělení pak už využili jako klasické kalibrační hustoty pro analýzu sekvenčních dat.
5. Konec kalibrací: tip-dating
Nejradikálnějším řešením by bylo kalibrační hustoty úplně vypustit a fosilie do analýzy zahrnout jako plnohodnotné koncové taxony neboli špičky (tips). Výhodu by to mělo ještě v jednom ohledu: kromě všech výše zmíněných problémů (subjektivita, nejasné interakce mezi kalibracemi navzájem i s jinými priory, omezené využití dostupného fosilního záznamu) musejí být fosilní kalibrace navíc napevno přiřazeny k určitému uzlu. Pokud ale chceme provést sdružený odhad topologie a stáří uzlů, měli bychom existenci jakéhokoli uzlu testovat, nikoli předpokládat. Pokud např. použijeme vegavise ke kalibraci divergence mezi kachnovitými (Anatidae) a husovcem (Anseranas), implicitně si tím vynucujeme monofylii kladu (husovec + kachnovití). To může vést k přehnané podpoře pro kalibrované uzly či odhady jejich stáří (Ronquist et al. 2012). Výjimkou je v tomto směru BEAST, který umí fosilní kalibraci přiřadit poslednímu společnému předkovi zadaných taxonů bez ohledu na to, jak obsáhlý je klad, který tímto předkem vzniká. Monofylii žádných uzlů si tedy nevynucuje. I v BEASTu ale platí, že fosilie nemají volnost zapadnout do libovolných míst stromu. Jejich příbuzenství s žijícími taxony je napevno nastaveno před analýzou, nikoli odhadováno coby její součást, a v praxi je přitom často nastaveno špatně. Do jisté míry je vina na straně molekulárních biologů, kteří nejsou dostatečně obeznámeni s paleontologickou literaturou a řídí se zastaralými údaji, protože si nevšimli nových interpretací kalibračních fosilií; do jisté míry jde o prostý důsledek faktu, že většina relevantních fosilií nebyla nikdy podrobena fylogenetické analýze. Např. u ptáků jsou špatně identifikované fosilie pro datovací analýzy chronickým problémem (Mayr 2005, 2013; Ksepka 2009).
Už nějakou dobu jsou přitom k dispozici modely evoluce pro morfologické znaky, které umožňují provést společnou (total-evidence) bayesovskou analýzu molekulárních a morfologických dat (Lewis 2001; Nylander et al. 2004). Mezi prvními, kteří se je pokusili využít k odhadu fylogenetické pozice kalibračních fosilií, byli Lee et al. (2009), jejichž postup byl celkově velmi neobvyklý. Autoři provedli klasickou (bezčasovou) analýzu kombinovaného morfologicko-molekulárního datasetu zahrnujícího kalibrační fosilii. Pro každý z 1000 nasbíraných stromů – bez ohledu na to, kde na něm fosilie stála – pak provedli oddělenou datovací analýzu semiparametrickým uhlazováním tempa evoluce. Nakonec sestrojili konsenzovou topologii, přičemž konfidenční intervaly pro stáří jejích uzlů spočítali přes všechny topologie. (Pokud např. poslední společný předek A a B byl na jednom stromě také předkem C, D a E a na druhém stromě ne, jeho stáří na konsenzovém stromě bylo zprůměrováno přes obě možnosti.) Lee a spol. tedy sice učinili výrazný pokrok tím, že vzali v úvahu nejistotu o fylogenetické pozici kalibrační fosilie, ale neprovedli skutečný sdružený odhad topologie a datace. Stromy, které získali, nebyly kalibrované a musely být datovány v odděleném, druhém kroku analýzy. Důvod, proč Lee a spol. zvolili tuto nepříliš spolehlivou kombinaci metod místo BEASTu, byl poměrně prozaický: BEAST v té době ještě neuměl analyzovat morfologické znaky.
Daleko více se ideálu přiblížil Pyron (2011), který využil faktu, že BEAST naopak už poměrně dlouho umožňoval kalibrovat strom nejen přiřazením fosilií k jeho uzlům, ale také zahrnutím špiček různého stáří. Drummond et al. (2006) tento typ kalibrace předvedli na příkladu virových sekvencí samplovaných v průběhu 17 let, nic ale nebrání aplikaci stejného principu na fosilie staré desítky či stovky milionů let. Od doby, co svou práci publikovali Lee a spol., byl už BEAST navíc doplněn o modely morfologické evoluce, a sdruženému total-evidence odhadu fylogeneze a stáří tedy už nic nestálo v cestě. Pyron použil 41 fosilií, z nichž pouhé 3 však spadaly do ingroup, tj. skupiny zájmu. Provedl dvě analýzy, z nichž v jedné byl model rychlostí evoluce (nekorelovaný lognormální) společný pro molekulární i morfologické znaky, zatímco v druhé obě sady dat obdržely samostatné modely. Autor nesdělil, jaký model speciace použil, což je znepokojivé, protože většina dostupných modelů se pro stromy s různě starými špičkami vůbec nehodí (viz níže).
Ronquist et al. (2012) k problému přistoupili důkladněji a zkompilovali rozsáhlý dataset žijících i fosilních blanokřídlých s velkým překryvem mezi morfologií a molekulami (téměř všechny žijící taxony byly samplovány na oba typy dat), kde se většina fosilií soustředila v rámci ingroup. Na rozdíl od Pyrona věnovali velkou pozornost výběru modelu speciace. Yuleův proces, který předpokládá nulové tempo vymírání, je evidentně nevhodný – pokud není každá analyzovaná fosilie předkem jiného taxonu, budou jeho předpoklady silně narušeny (Heath & Moore 2014). Proces množení a zániku je realističtější a byl rozšířen i na případy, kdy jsou špičky stromu samplovány z více než jednoho časového horizontu (Stadler 2010; Stadler & Yang 2013), je ale velmi citlivý na velikost a výběr vzorku. Z koalescenčního procesu lze spočíst pravděpodobnostní hustotu pro stromy se špičkami o různém stáří celkem jednoduše, Ronquist a spol. jej však zamítli s tím, že se hodí více pro genové stromy než druhové stromy odhadované z kombinovaných dat. Místo toho se rozhodli zobecnit uniformní apriorní rozdělení pro datované topologie na stromy s různě starými špičkami. Ve výsledném modelu speciace jsou stáří uzlů tahána z uniformních rozdělení s maximem ve stáří kořene a minimem ve stáří špičky. Strom se sestrojí tak, že v každém vnitřním uzlu, od nejmladšího po ten nejstarší, necháme splynout dvě náhodně vybrané linie existující v daném čase. S tímto modelem Ronquist et al. (2012) provedli celou řadu analýz. Jejich úplný přehled poskytuje flowchart přetištěný níže; stručné shrnutí postupu nabízím pod ním:
Easy, right? (Zdroj: Ronquist et al. 2012: Figure 1)
- Sestav molekulární dataset $D_1$ pro žijící zástupce taxonu $T$.
- Sestav morfologický dataset $D_2$ pro žijící zástupce $T$ (ideálně tak, aby se překrýval s $D_1$).
- Sestav morfologický dataset $D_3$ pro relevantní fosilie z taxonu $T$.
- Zkombinuj $D_1$ a $D_2$ do total-evidence datasetu $D_{1+2}$.
- Proveď bezčasovou bayesovskou analýzu $A_1$ datasetu $D_{1+2}$, která ověří, zda je $D_{1+2}$ schopen rozřešit příbuzenské vztahy uvnitř $T$, a ukáže, zda jsou mezi jednotlivými větvemi podstatné rozdíly v rychlosti evoluce.
- Ponech si takovou topologii $\tau$ z $A_1$, která má nejvyšší aposteriorní pravděpodobnost.
- Použij bezčasovou analýzu $A_2$ a analýzu $A_3$ se striktními molekulárními hodinami k odhadu délek větví pro $\tau$.
- Nastav apriorní pravděpodobnosti pro analýzy využívající různé modely relaxovaných hodin ($A_{TK02}$, $A_{CPP}$ a $A_{IGR}$) podle kroků 9 a 10.
- Sestroj graf závislosti rozptylu délek větví z $A_2$ na čase (měřeném pomocí $A_3$) a prolož jím regresní přímku. Použij její sklon ke stanovení hyperpriorů pro jednotlivé modely rychlostí evoluce: pro $A_{IGR}$ přímo, pro $A_{TK02}$ a $A_{CPP}$ pomocí simulace.
- Otestuj, nakolik je výška stromu* v analýzách se striktními hodinami citlivá na různé apriorní pravděpodobnosti. Vyděl medián aposteriorního rozdělení výšek stromů odhadem stáří taxonu $T$ založeným na fosilní kalibraci. Použij výsledek jako střední hodnotu apriorního rozdělení pro rychlosti evoluce.
- Použij Bayesův faktor k porovnání, jak si vedou $A_{TK02}$, $A_{CPP}$ a $A_{IGR}$ při použití kalibračních hustot (dataset $D_{1+2}$ + fosilní kalibrace) a při zahrnutí fosilií jako špiček (dataset $D_{1+2+3}$).
Co se topologie týče, nejlepší výsledky podala bezčasová analýza. Striktní molekulární hodiny odkryly bizarní topologii, ve které hmyz s dokonalou proměnou (Holometabola) netvořil monofyletickou skupinu; ani vynucení jeho monofylie ale zbytek stromu "nespravilo". Stromy založené na relaxovaných hodinách byly obdobně nedůvěryhodné (v topologii vzešlé z IGR, kterou autoři přetiskli, už nebyla monofyletická ani ingroup, tj. blanokřídlí; jedna její část měla blíž k taxonům s nedokonalou proměnou), ale po vynucení monofylie Holometabola se vrátily k normálu. Ronquist et al. (2012) proto doporučují nadále používat k zakořeňování stromů outgroup – dokonce i v analýzách s relaxovanými hodinami, které ji technicky vzato nepotřebují. Srovnání relaxovaných hodin na základě Bayesova faktoru při použití fosilních kalibrací favorizovalo autokorelované modely (TK02 a CPP), což není překvapivé, protože přítomnost slabé autokorelace v rychlostech evoluce už předtím potvrdil přídavný rozbor. Použití fosilií jako špiček ale pořadí modelů prudce změnilo: TK02 se propadl, IGR se vyrovnal CPP nebo ho dokonce překonal. Výsledky z IGR také údajně lépe sedí na fosilní záznam, protože nevyžaduje tak dlouhé mezery bez známých fosilií (ghost lineages). (Nejsem si jistý, zda tohle autorům věřit. IGR obecně odkrývá staré korunní klady a krátké kmenové linie, což by mělo ghost lineages spíš prodlužovat.)
Nejzajímavější jsou ale rozdíly mezi klasickým datováním pomocí kalibrací a tip-datingem. Je dobré uvést, že ani analýza s fosilními špičkami nebyla zcela prosta kalibrací (stejně jako u Pyrona). Ronquist a spol. kalibrovali kořen stromu, jak vyžadoval jejich uniformní model speciace, a kořen Holometabola, kde by odstranění kalibrace vyžadovalo zahrnutí řady dalších fosilií pro outgroup. Hraní si se střední hodnotou příslušných kalibračních hustot (ekvivalentní tomu, co dělali Warnock et al. 2012) ale ukázalo, že tip-dating analýza je na kalibrace méně citlivá než klasický postup. Rozdílné byly i výsledky: datování pomocí špiček odkrylo mladší data pro uzly mimo blanokřídlé a dva uzly uvnitř blanokřídlých, všude jinde byla naopak výsledná stáří vyšší než za použití kalibrací. Tip-dating byl také přesnější, což se projevilo užšími 95% intervaly nejvyšší aposteriorní hustoty. Snad nejvíc se ale výhody této metody projevily ve výsledné fylogenetické pozici zahrnutých fosilií. Ta byla v mnoha případech extrémně nejistá a aposteriorní pravděpodobnost i toho nejlepšího odhadu občas nepřesáhla 0,3. Ze sedmi fosilií, které byly přiřazeny ke konkrétním uzlům v analýzách s kalibracemi, jen tři zaujaly stejnou pozici v total-evidence analýze s aposteriorní pravděpodobností vyšší než 0,5. Ve dvou případech dokonce aposteriorní pravděpodobnost pozice, která byla předpokládána pro analýzu s kalibracemi, činila přesně 0.
Srovnání 95% intervalů nejvyšší aposteriorní hustoty z datace založené na kalibračních hustotách (modré pruhy) a z total-evidence datace s fosilními špičkami (červené pruhy). Topologie stromu pochází z druhé ze jmenovaných analýz a od topologie založené na kalibracích se liší ve dvou uzlech. Bílé šipky ukazují, jakým směrem a o kolik se posunul medián stáří uzlu v tip-datingu oproti analýze s kalibračními hustotami. Je vidět, že zatímco u báze stromu poskytoval tip-dating mladší výsledky, uvnitř blanokřídlých tomu bylo téměř vždy naopak. (Zdroj: Ronquist et al. 2012: Figure 9)
Autoři se také věnovali otázce, zda morfologickým a molekulárním datům dát oddělené modely rychlostí evoluce, nebo použít jediný model společný. Zvolili druhou možnost, a to ze dvou důvodů. První z nich byl pragmatický: významný nárůst v počtu parametrů (rychlostí) by mohl zkomplikovat konvergenci MCMC a hrozí, že výsledný model by byl přeparametrizovaný. Druhým důvodem je, že délky větví na bezčasových stromech založených na morfologii a na molekulách spolu jasně korelují (tzn., že větve, které jsou dlouhé na jednom stromě, jsou dlouhé i na druhém). Ronquist a spol. ale zdůrazňují, že i oddělené modelování stojí za další výzkum.
V závěru autoři konstatují, že tip-dating by měl být upřednostněn před klasickým přístupem založeným na kalibracích kdekoli, kde je to jen možné. Informace z fosilií začleňuje přímo a nespoléhá na druhotné interpretace, které mohou být chybné. Podává rovněž přesnější výsledky, což ukazuje, že s fosiliemi pracuje efektivněji. V neposlední řadě má používání fosilií coby špiček motivovat autory, aby se zaměřili na dosud spíše přehlížené aspekty datování – studium fosilií a jejich morfologických znaků, modelování morfologické evoluce a vývoj sofistikovanějších modelů speciace.
6. Reakce a kritika
Celkové přijetí postupů Pyrona (2011) a Ronquista a spol. (2012) se zdá být poměrně entuziastické. Vzhledem k tomu, že tip-dating je nyní dostupný v obou velkých softwarových balíčcích pro bayesovskou fylogenetiku (MrBayes 3.2 a BEAST), studií využívajících této metody rychle přibývá: Lee et al. (2013); Slater (2013); Wood et al. (2013); Near et al. (2014); Tseng et al. (2014). Líbí se mi, že hned dvě práce z tohoto stále dosti úzkého okruhu se zabývaly fosilními pan-aviany – o těch budu psát v příštích dvou dílech této série. Ne vždy se ale tento přístup ukázal být spolehlivým. Vilhelmsen & Zimmermann (2014), kteří se pokusili k datování využít výhradně morfologické znaky, zaznamenali, že pro některé uzly činil rozptyl odhadovaných stáří přes 300 milionů let – jak sami konstatují, zřejmě proto, že jejich analýza obsahovala příliš málo fosilií v poměru k žijícím taxonům. Lee et al. (2013) zjistili, že zatímco tip-dating v BEASTu pro jejich dataset funguje bezproblémově, MrBayes měl v kombinaci s modelem IGR potíže s konvergencí, a pokud zkonvergoval, pak na naprosto bizarních stromech. Vysoce nespolehlivé byly i odhady rychlostí evoluce, které v některých případech kolísaly o šílených osm řádů.
Dostupnost tip-datingu také nutí autory, aby explicitně odůvodnili další užívání kalibrací. Příkladem je např. nedávná studie o původu pěvců (Ericson et al. 2014; na blogu krátce zde), na které se podílela i jedna ze spoluautorek Ronquista a spol. (2012) a která použila stejný zobecněný uniformní model speciace – avšak pro tradiční analýzu s kalibračními hustotami. Autoři přiznali, že přímé zahrnutí fosilií představuje lepší postup, konstatovali však, že rozsáhlé datasety s velkým počtem morfologických znaků kódovaných pro žijící i fosilní taxony nejsou pro většinu skupin dostupné. Podobně argumentovaly i jiné studie.
Některé práce zašly dál a nabídly kritický pohled na tip-dating. Heath & Moore (2014) označují za možný problém této techniky chybějící data. Pro tip-dating jsou potřeba datové matice, které kombinují morfologické a molekulární znaky. Vzhledem k tomu, že od fosilií téměř nikdy žádná molekulární data nemáme (i ze subfosilních taxonů typu sloních ptáků je velmi těžké vytáhnout aspoň kompletní mitochondriální genom), jsou tyto matice plné nenáhodně rozložených chybějících dat. To sice nemusí nutně zkreslit topologii, může to ale zasáhnout délky větví (a tím pádem i stáří uzlů). Je ale fér uvést, že jak Pyron (2011), tak i Ronquist et al. (2012) se pokusili tento problém adresovat. První jmenovaný hledal korelaci mezi délkou větve a množstvím dat známým od taxonu na jejím konci; žádné zkreslení odhadů stáří ale neodhalil. Ronquist a spol. vycházeli z předpokladu, že pokud nekompletnost fosilií zkresluje délky větví, ty nejméně kompletní by je měly zkreslovat nejvíce. Vyřazení fosilií, které byly kódovány pro méně než 10% morfologických znaků, ale vyprodukovalo téměř shodné mediány stáří uzlů, jaké odhalila kompletní analýza. Autoři proto usoudili, že informace, které fosilie poskytují, přebíjejí problémy plynoucí z jejich nekompletnosti.
Heath & Moore (2014) také uvádějí, že není jisté, do jaké míry lze evoluci morfologických znaků popsat (relaxovanými) hodinami. Přijímají sice argumenty Ronquista a spol., podle kterých je určitá korelace mezi morfologickou odlišností dvou taxonů a dobou uplynulou od jejich divergence nevyhnutelným důsledkem evoluce, namítají ale, že morfologické hodiny mohou "tikat" jiným tempem než ty molekulární. Pyronův postup, ve kterém jsou morfologickým a molekulárním datům přiděleny samostatné modely rychlostí evoluce, sice tento problém zdánlivě řeší, viz ale poznámku výše o přeparametrizaci a obtížné konvergenci. Zdá se tedy, že ideální je řídit se protokolem Ronquista a spol., analyzovat nejprve oba typy dat odděleně a porovnat, jak spolu korelují výsledné délky větví či stáří uzlů. Heath a Moore dále argumentují, že selekční tlaky, kterým morfologie podléhá, mohou způsobovat heterotachii – jev, kdy se rychlosti evoluce liší jak mezi znaky, tak napříč stromem.* Pak by byl předpoklad, že jediné hodiny platí pro všechny morfologické znaky, zjevně chybný. Možným protiopatřením (dodávám já) by bylo rozdělit morfologický dataset na několik oddílů, např. podle Bayesova faktoru – jak to udělali Clarke & Middleton (2008) ve své bezčasové bayesovské analýze ptačí morfologické evoluce – a každému přidělit samostatný model rychlostí evoluce; zde ale opět vyvstává riziko přeparametrizace.
*Heterotachie nesmí být zaměňována za prosté rozdíly v rychlosti evoluce napříč znaky (rates-across-sites heterogeneity, RAS). Existující modely morfologické evoluce adresují RAS a u každého znaku sčítají přes několik rychlostních kategorií, stále ale předpokládají, že poměr délek větví zůstává v každé kategorii konstantní. Pokud tedy znak 1 prodělá na větvi A 0,03 substitucí a znak 2 0,05 substitucí, na třikrát delší větvi B musí znak 1 prodělat 0,09 substitucí a znak 2 0,15 substitucí. Pokud ale evoluce podléhá heterotachii, počet substitucí na větvi B může činit 0,09 pro znak 1 a např. 0,02 pro znak 2. Chceme-li se s heterotachií vypořádat při modelování evoluce, musíme pro oba znaky specifikovat jinou sadu délek větví. Krátce jsem o tom na blogu psal zde.
Výsledky tip-datingu Ronquista a spol. Malé rozlišení stromu způsobují nekompletní fosilie s nejistou pozicí: odstíny šedé v políčkách vpravo ukazují, pro kolik morfologických znaků byl daný taxon kódován. Čísla nad uzly udávají aposteriorní pravděpodobnost. (Zdroj: Ronquist et al. 2012: Figure 7)
Poslední kritika Heathové a Moore'a se týká nedostatku modelů speciace vhodných pro tip-dating. Zobecněný uniformní model Ronquista a spol. podle autorů není biologicky smysluplným popisem procesů, které generují strom (Heath & Moore 2014: 315). Takový popis by měl zahrnovat jak diverzifikaci, tak i uchovávání fosilií a jejich sampling. První pokroky v tomto směru už ale byly učiněny (viz níže)
Tip-dating byl diskutován i z čistě paleontologického hlediska. Prvním v tomto směru byl zřejmě Laurin (2012), jehož kritika ale byla dost neinformovaná. Podle něj datování s fosilními špičkami vyžaduje, aby byly na morfologickou evoluci aplikovány modely původně vyvinuté pro molekulární data. Větší složitost morfologických znaků má přitom snižovat pravděpodobnost, že jednoduchý model bude pro jejich evoluci adekvátním popisem. (Častý omyl: model je vždy zjednodušený, nikdy nemá jít o detailní a realistický popis modelovaného systému.) Za největší překážku Laurin považuje fakt, že zatímco modely evoluce vyžadují nezkreslený vzorek všech znaků, skoro všechny existující morfologické datasety zahrnují jen znaky informativní pro parsimonii (čili znaky, kde je každý stav přítomen minimálně u dvou taxonů). Už dlouho je ale dostupný model, který takto zkreslený výběr znaků dokáže korigovat (Nylander et al. 2004), ačkoli zatím jen v programu MrBayes. Jeho statistické vlastnosti detailně analyzovali Allman et al. (2010), kteří dokázali, že s 8 a více taxony jsou jeho parametry identifikovatelné, a poskytuje tedy statisticky konzistentní odhad fylogeneze. Laurin dále argumentuje, že tip-dating může být poněkud nepraktický kvůli nedostatku velkých morfologických datasetů, přesto ale uznává jeho potenciál (Laurin 2012: 13).
Pro paleontology je tip-dating obzvlášť zajímavý v souvislosti s rostoucím zájmem o evoluci znaků. Jak konstatuje Bapst (2014), v poslední době začali paleontologové přebírat neontologické metody (vyvinuté pro molekulární fylogeneze se stejně starými špičkami) k výzkumu takových otázek, jako "Proběhla v nějaké skupině nebo časovém intervalu změna relativní rychlosti evoluce určitého znaku?" nebo "Jaký je vztah mezi znaky, či mezi znakem a určitým faktorem prostředí?". Tyto metody ale vyžadují datované stromy, které parsimonie – v paleontologii nejpoužívanější fylogenetická metoda – nedokáže poskytnout. Simultánní odhad topologie a stáří uzlů pro fosilní taxony by byl ideální, a řada paleontologů do něj proto vkládá velké naděje (Bapst 2013, 2014; Slater & Harmon 2013). I zde se ale objevují určité výhrady. Tou nejčastější je, že dostupné implementace tip-datingu neberou v úvahu procesy, které ovlivňují výběr použitého vzorku taxonů – především frekvenci uchovávání a nalézání fosilií. Zpřesnění by mohly přinést modely, ve kterých jsou tempa fosilizace tahána z určitého pravděpodobnostního rozdělení, se samostatným rozdělením pro každou biogeografickou oblast (Slater & Harmon 2013). Bapst (2013) také podotýká, že existující bayesovské metody nedokážou pracovat se vztahy typu předek-potomek, což může při nakládání s fosilním záznamem představovat problém. Pennell & Harmon (2013) se rovněž vracejí k problému nenáhodně rozložených chybějících dat, považují jej ale spíš za riziko pro následovné analýzy znakové evoluce než pro tip-dating samotný.
7. Kde jsme teď
Jak již bylo řečeno, tip-dating byl přijat s entuziazmem a rychle se rozšiřuje. Tento trend bude téměř jistě pokračovat: podle Bapsta (2014) nejenže mají bayesovské analýzy s fosilními špičkami šanci stát se převládající metodou pro tvorbu datovaných paleontologických stromů, ale mohou se stát sjednocujícím přístupem aplikovatelným na širokou škálu datasetů, pro které zatím potřebujeme řadu různých ad hoc metod.
Do budoucna lze bezesporu očekávat další zlepšování metod navržených Pyronem (2011) a Ronquistem a spol. (2012). Ukázku takového zlepšení nedávno nabídli Heath et al. (2014), kteří vyvinuli nový model speciace, nazvaný "fosilizovaný proces množení a zániku" (Fossilized Birth-Death Process, FBD). Ten vůbec poprvé předpokládá, že fosilie jsou produktem stejného větvícího procesu, který generuje zbytek stromu. Přestože model předpokládá konstantní tempo speciace, vymírání a fosilizace, detailní simulace ukázaly, že je vůči narušení těchto předpokladů velmi robustní: ani zkreslený výběr fosilií, ani zkreslený výběr žijících taxonů nemá na výsledné odhady stáří vliv; a pokud se zajímáme jen o stáří uzlů a nikoli o celou komplexní makroevoluční dynamiku, lze tempa speciace, vymírání a fosilizace vyintegrovat jako náhodné proměnné. FBD je navíc použitelný jak pro tip-dating, tak i pro klasické analýzy založené na kalibracích, ze kterých ale odstraňuje nutnost používat kalibrační hustoty. Místo toho poskytuje sjednocené apriorní rozdělení pro kalibrované i nekalibrované uzly, a dokonce umožňuje vzít v úvahu i nejistotu ohledně fylogenetické pozice fosilií.
8. Acknowledgments
Děkuji Tracy Heathové za to, že mi poslala kopii své vynikající práce shrnující dostupné metody bayesovského datování, a Davidu Bapstovi za přístup k řadě dalších studií citovaných v tomto článku, včetně jeho vlastních prací.
Zdroje:
- http://treethinkers.org/wp-content/uploads/2013/04/DivTime_BEAST_tutorial_2013.pdf
- http://www.phyletica.com/downloads/teaching/applied-phylogenetics/div-time-tutorial.pdf
- http://www.beast2.org/...What_units_are...root_heights...expressed_in...
- http://pythonhosted.org/ete2/tutorial/tutorial_trees.html
- http://beast-mcmc.googlecode.com/files/BEAST14_Manual_6July2007.pdf
- http://www.slideshare.net/trayc7/heath-evolution-2013
- Allman ES, Holder MT, Rhodes JA 2010 Estimating trees from filtered data: Identifiability of models for morphological phylogenetics. J Theor Biol 263(1): 108–19
- Bapst DW 2013 A stochastic rate-calibrated method for time-scaling phylogenies of fossil taxa. Methods Ecol Evol 4(8): 724–733
- Bapst DW 2014 Preparing paleontological datasets for phylogenetic comparative methods. 515–44 in Garamszegi LZ, ed. Modern Phylogenetic Comparative Methods and Their Application in Evolutionary Biology. Berlin and Heidelberg: Springer-Verlag
- Brown JW, Rest JS, García-Moreno J, Sorenson MD, Mindell DP 2008 Strong mitochondrial DNA support for a Cretaceous origin of modern avian lineages. BMC Biology 6:6
- Brown JW, van Tuinen M 2011 Evolving perceptions on the antiquity of the modern avian tree. 306–24 in Dyke GJ, Kaiser G, eds. Living Dinosaurs: The Evolutionary History of Modern Birds. London: John Wiley and Sons
- Clarke JA, Middleton KM 2008 Mosaicism, modules, and the evolution of birds: results from a Bayesian approach to the study of morphological evolution using discrete character data. Syst Biol 57(2): 185–202
- Clarke JT, Warnock RCM, Donoghue PCJ 2011 Establishing a time-scale for plant evolution. New Phytol 192: 266–301
- Dornburg A, Beaulieu JM, Oliver JC, Near TJ 2011 Integrating fossil preservation biases in the selection of calibrations for molecular divergence time estimation. Syst Biol 60(4): 519–27
- Drummond AJ, Ho SYW, Phillips MJ, Rambaut A 2006 Relaxed phylogenetics and dating with confidence. PLoS Biol 4(5): e88
- Ericson PGP, Klopfstein S, Irestedt M, Nguyen JMT, Nylander JAA 2014 Dating the diversification of the major lineages of Passeriformes (Aves). BMC Evol Biol 14: 8
- Heath TA 2012 A hierarchical Bayesian model for calibrating estimates of species divergence times. Syst Biol 61(5): 793–809
- Heath TA, Huelsenbeck JP, Stadler T 2014 The fossilized birth–death process for coherent calibration of divergence-time estimates. Proc Natl Acad Sci USA doi:10.1073/pnas.1319091111
- Heath TA, Moore BR 2014 Bayesian inference of species divergence times. 277–318 in Chen M-H, Kuo L, Lewis PO, eds. Bayesian Phylogenetics: Methods, Algorithms, and Applications. Boca Raton, FL: Chapman & Hall/CRC
- Heled J, Drummond AJ 2012 Calibrated tree priors for relaxed phylogenetics and divergence time estimation. Syst Biol. 61(1): 138–49
- Heled J, Drummond AJ 2013 Calibrated birth-death phylogenetic time-tree priors for Bayesian inference. arXiv:1311.4921 [q-Bio], November 19
- Ksepka DT 2009 Broken gears in the avian molecular clock: new phylogenetic analyses support stem galliform status for Gallinuloides wyomingensis and rallid affinities for Amitabha urbsinterdictensis. Cladistics 25: 173–97
- Laurin M 2012 Recent progress in paleontological methods for dating the Tree of Life. Front Genet 3: 130
- Lee MSY, Oliver PM, Hutchinson MN 2009 Phylogenetic uncertainty and molecular clock calibrations: A case study of legless lizards (Pygopodidae, Gekkota). Mol Phylogenet Evol 50(3): 661–6
- Lee MSY, Soubrier J, Edgecombe GD 2013 Rates of phenotypic and genomic evolution during the Cambrian explosion. Curr Biol 23: 1889–95 [Supplemental Information]
- Lewis PO 2001 A likelihood approach to estimating phylogeny from discrete morphological character data. Syst Biol 50(6): 913–25
- Marjanović D, Laurin M 2007 Fossils, molecules, divergence times, and the origin of lissamphibians. Syst Biol 56(3): 369–88
- Mayr G 2005 The Paleogene fossil record of birds in Europe. Biol Rev 80(4): 515–42
- Mayr G 2013 The age of the crown group of passerine birds and its evolutionary significance – molecular calibrations versus the fossil record. Syst Biodivers 11(1): 7–13
- Near TJ, Dornburg A, Friedman M 2014 Phylogenetic relationships and timing of diversification in gonorynchiform fishes inferred using nuclear gene DNA sequences (Teleostei: Ostariophysi). Mol Phylogenet Evol doi:10.1016/j.ympev.2014.07.013
- Nylander JAA, Ronquist F, Huelsenbeck JP, Nieves-Aldrey JL 2004 Bayesian phylogenetic analysis of combined data. Syst Biol 53(1): 47–67
- Parham JF, Donoghue PCJ, Bell CJ, Calway TD, Head JJ, Holroyd PA, Inoue JG, Irmis RB, Joyce WG, Ksepka DT, Patané JSL, Smith ND, Tarver JE, van Tuinen M, Yang Z, Angielczyk KD, Greenwood JM, Hipsley CA, Jacobs L, Makovicky PJ, Müller J, Smith KT, Theodor JM, Warnock RCM, Benton MJ 2012 Best practices for justifying fossil calibrations. Syst Biol 61(2): 346–59
- Pennell MW, Harmon LJ 2013 An integrative view of phylogenetic comparative methods: connections to population genetics, community ecology, and paleobiology. Ann N Y Acad Sci 1289: 90–105
- Pyron RA 2011 Divergence time estimation using fossils as terminal taxa and the origins of Lissamphibia. Syst Biol 60(4): 466–81
- Ronquist F, Klopfstein S, Vilhelmsen L, Schulmeister S, Murray DL, Rasnitsyn AP 2012 A total-evidence approach to dating with fossils, applied to the early radiation of the Hymenoptera. Syst Biol 61(6): 973–99
- Slater GJ 2013 Phylogenetic evidence for a shift in the mode of mammalian body size evolution at the Cretaceous-Palaeogene boundary. Methods Ecol Evol 4(8): 734–44
- Slater GJ, Harmon LJ 2013 Unifying fossils and phylogenies for comparative analyses of diversification and trait evolution. Methods Ecol Evol 4(8): 699–702
- Stadler T 2010 Sampling-through-time in birth-death trees. J Theor Biol 267(3): 396–404
- Stadler T, Yang Z 2013 Dating phylogenies with sequentially sampled tips. Syst Biol 62(5): 674–88
- Tseng ZJ, Wang X-M, Slater GJ, Takeuchi GT, Li Q, Liu J, Xie G-P 2014 Himalayan fossils of the oldest known pantherine establish ancient origin of big cats. Proc R Soc B 281(1774): 20132686
- Vilhelmsen L, Zimmermann D 2014 Baltorussus total makeover: Rejuvenation and sex change in an ancient parasitoid wasp lineage. PLOS ONE 9(6): e98412
- Warnock RCM, Yang Z, Donoghue PCJ 2012 Exploring uncertainty in the calibration of the molecular clock. Biol Lett 8(1): 156–9
- Wertheim JO, Sanderson MJ, Worobey M, Bjork A 2010 Relaxed molecular clocks, the bias–variance trade-off, and the quality of phylogenetic inference. Syst Biol 59(1): 1–8
- Wilkinson RD, Steiper ME, Soligo C, Martin RD, Yang Z, Tavaré S 2011 Dating primate divergences through an integrated analysis of palaeontological and molecular data. Syst Biol 60(1): 16–31
- Wood HM, Matzke NJ, Gillespie RG, Griswold CE 2013 Treating fossils as terminal taxa in divergence time estimation reveals ancient vicariance patterns in the palpimanoid spiders. Syst Biol 62(2): 264–84
- Yang Z, Rannala B 2006 Bayesian estimation of species divergence times under a molecular clock using multiple fossil calibrations with soft bounds. Mol Biol Evol 23(1): 212–26