pan-Aves


Zleva doprava: ara hyacintový (Anodorhynchus hyacinthinus), zdroj: flickr.com (JMJ32); Gigantoraptor a Alectrosaurus, autor Luis V. Rey

Proč neexistují "běžci" (Ratitae), díl 3. – protože to říkají retropozony

Viz také:

1. Úvod

    Když jsem se v posledních dnech roku 2011 začítal do Living Dinosaurs, v kapitole z pera Brada Livezeye mě velmi zaujala následující zmínka:
An hypothesis of polyphyly of ratites indicated by sequence data from at least one nuclear gene (Harshman et al., 2008; but see Omland, 1994, 1997) – essentially limited to linking Tinamiformes with sympatric Rheiformes among other, morphologically diverse ratites – apparently is contradicted with evidence from virtually homoplasy-free molecular short interspersed repetitive elements[.]

Livezey 2011:126
    Zajímavá mi přišla hned ze dvou důvodů. Zaprvé, Harshman et al. (2008) se svým zamítnutím "běžčí" monofylie napadli hypotézu, která nebyla vážně zpochybněna už více než třicet let, a tak zajímavá událost se jen tak nevidí. Zatímco předchozí pochybovači většinou neměli v rukou žádná data, která by stála za řeč (naopak museli obrovské množství dat ignorovat, pro začátek třeba veškerou genetiku), a nenechali si do svého úsudku mluvit žádnou numerickou metodou, Harshman a spol. přišli s cutting-edge statistickou fylogenetikou a mnohakilobázovými sekvencemi DNA. Kdyby se ukázalo, že to celé byl prostě omyl, jak Livezey naznačuje, byl by to konec poněkud nudný.
    Pravdou je, že Livezeyův text je poněkud zmatený (na což jsem poukazoval i ve své recenzi Living Dinosaurs). Tak např. krátké vmezeřené elementy (Short Interspersed Nuclear Elements, SINEs) u ptáků prakticky nenajdeme; tam jsou častější LINEs (Long Interspersed Nuclear Elements, dlouhé vmezeřené elementy) a LTRs (Long Terminal Repeats, dlouhé koncové repetice). Přesto je nutné brát tuto zmínku vážně, protože retropozony, tedy třída genomických elementů zahrnující všechny vyjmenované podskupiny, jsou téměř prosté normální homoplazie. Pravděpodobnost, že by tentýž retropozon vklouzl nezávisle na to samé místo u dvou vývojových větví, je totiž velice nízká – na rozdíl od pravděpodobnosti, že nukleotidová pozice bude nezávisle obsazena stejnou bází. V běžných molekulárních analýzách je každý nukleotid samostatným znakem, který může přecházet jen mezi čtyřmi různými stavy, u retropozonů nás ale zajímá jen přítomnost či absence konkrétního elementu (dlouhého klidně i tisíce nukleotidů) na daném místě. Dokud umíme přesně identifikovat typ retropozonu a místo jeho inzerce, nemusí nás bodové mutace v jeho sekvenci vůbec zajímat.
    V době, kdy Livezey psal svůj text, už nebyly retropozony v ptačí fylogenetice novinkou (Watanabe et al. 2006; Kriegs et al. 2007), a chvíli po vydání knihy dokonce přišla první na nich založená velkoškálová studie, jejíž výsledky byly skutečně působivé. Suh et al. (2011) v ní potvrdili řadu spíše kontroverzních skupin podporovaných sekvenčními daty a ukázali, že u báze Neoaves došlo k velice rychlé diverzifikaci. Retropozonový výzkum paleognátů, na nějž Livezey odkazoval, se mi ale dohledat nepodařilo. Napsal jsem proto Alexanderu Suhovi, který mě laskavě odkázal na abstrakt z Mezinárodního ornitologického kongresu, v němž Baker a Haddrath – autoři, kteří nejsou v molekulární fylogenetice a biogeografii paleognátů žádnými nováčky (Haddrath & Baker 2001; Baker et al. 2005) – shrnuli dosavadní výsledky svého výzkumu. Situace pro polyfylii "běžců" skutečně nevypadala dobře:
Using 29 genes and 23 retroposon insertions we show that polyphyly of the ratites is an artefact of ancient incomplete lineage sorting and the use of concatenated sequences in phylogenetics. When the joint posterior distribution of gene trees and the species tree are estimated using a coalescent framework, the extant ratites are shown to be monophyletic, as in classical morphological studies.

Baker & Haddrath 2010:129

2. Retropozony odkrývají záhady paleognátí evoluce

    Nyní Baker s Haddrathem svůj dlouholetý výzkum konečně dokončili; jeho výstupem je nová publikace v Proceedings of the Royal Society B. Autoři téma otevírají shrnutím současného pohledu na evoluci paleognátů: poslední společný předek žijících paleognátů pravděpodobně uměl létat a předkové dnešních zástupců skupiny na různé kontinenty prostě doletěli přes oceán potom, co se Gondwana rozpadla. Oproti tradičnímu scénáři (ancestrální nelétavost + vikariance kontinentálním driftem) tato varianta daleko lépe sedí na nové fylogenetické hypotézy, v nichž jsou tinamy usazeny hluboko uvnitř "běžců" namísto toho, aby šlo o jejich sesterskou skupinu (Harshman et al. 2008; Phillips et al. 2010), a také na výsledky molekulárního datování (Phillips et al. 2010). Haddrath a Baker konstatují, že tyto změny v náhledu na evoluci paleognátů s sebou nesou důsledky i pro další kontroverzní témata, jako je poměrný význam vikariance a rozptylu na utváření gondwanské fauny nebo datování velké a rapidní ptačí diverzifikace.
    Problémem, který výše citované studie nerozřešily, je vzájemný vztah australasijských běžců (skupiny zahrnující kivie, emu, kasuáry a v rozporu s názvem asi i madagaskarské sloní ptáky), nanduů a kladu zahrnujícího létavé jihoamerické tinamy a nelétavé novozélanské ptáky moa. V této oblasti stromu vidíme extrémně krátké vnitřní větve ("internodes") kombinované s dlouhými větvemi vedoucími ke koncovým taxonům, což je typické pro velmi rychlé, "explozivní" evoluční radiace – pro nejbližší příklad nemusíme chodit daleko, jednu takovou máme třeba u báze kladu Neoaves (Chojnowski et al. 2008; Suh et al. 2011; Matzke et al. 2012). Jak Haddrath a Baker pěkně vysvětlují, intervaly mezi jednotlivými speciacemi jsou v takových případech tak krátké, že v nich stačí vzniknout jen málo znaků, které se navíc mohou zcela ztratit pod nánosem novějších mutací na dlouhých koncových větvích. Pokud navíc není štěpící se populace dostatečně malá, genetický drift nestačí za tento časový interval zafixovat všechny polymorfizmy – ty pak vymizí až po dalších divergencích, a to se může stát i způsobem, který není s pořadím divergencí konzistentní. Fylogenetický strom pro kopie genu přítomné u různých taxonů se pak nemusí shodovat s fylogenetickým stromem pro tyto taxony samotné. (Toto vysvětlení nekompletního třídění linií jsem na blogu použil už několikrát, ale Joe Felsenstein upozorňuje, že výhodnější může být přemýšlet o celém jevu ze zpětného pohledu, tj. z hlediska koalescence – sledovat splývání genových linií s tím, jak postupujeme v čase zpátky.) Tento problém se samozřejmě nevyhýbá ani lokusům obsahujícím retropozony, takže ani ty zde situaci nezachrání, a klasický postup – analýza co největšího množství zřetězených (concatenated) genových sekvencí – může být dokonce "pozitivně zavádějící", pokud druhový strom neodpovídá nejčastějšímu genovému stromu (Degnan & Rosenberg 2006). Namapováním morfologických znaků či geografie na špatný strom samozřejmě dostaneme zcela chybnou představu o evoluci skupiny.
    Odhalit správnou fylogenezi paleognátních ptáků je tedy kriticky důležité, a Haddrath s Bakerem k tomu účelu sestavili dataset z 10 nových jaderných genů, osekvenovaných pro obsáhlý vzorek paleognátů (16 taxonů) a také neobyčejně důkladně samplovanou outgroup, sestávající z 15 neognátních ptáků a dvou krokodýlů. Neognáti zde přitom neslouží jen k zakořenění paleognátího stromu, ale i jako zdroj fosilií vhodných ke kalibraci molekulárních hodin.* Už tradičním postupem je v podobných studiích vyzkoušet, co se stane, když nová, nezávislá data přidáme k těm původním, jejichž výsledky chceme testovat (Wang et al. 2011; Smith et al. 2012) – zkombinovat datasety a nechat je porvat se mezi sebou, ať se ukáže, který nese nejsilnější signál, je konec konců nejjednodušší způsob, jak rozřešit jejich vzájemné konflikty. 10 nových genů tedy bylo připojeno k datasetu z projektu Early Bird, který zahrnuje 18 lokusů osekvenovaných pro široký vzorek paleognátů (Harshman et al. 2008) i neognátů (Hackett et al. 2008). Z těchto osmnácti byl však jeden obsažen už v novém 10-genovém datasetu, a pozorný čtenář si může všimnout, že dohromady je tedy lokusů jen 27, zatímco abstrakt z předminulého roku jich hlásil 29. Důvod je prostý: Haddrath a Baker se rozhodli získat pro tyto geny sekvence i od vymřelého moa křovinného** (Anomalopteryx didiformis), který součástí původních datasetů nebyl, a to nebylo pro dva geny možné***. Nevýhodou dále byl nepřekrývající se taxon sampling: Hackett et al. (2008) třeba měli v analýze jiné "druhy" čápů nebo tinam než Haddrath a Baker, které musely být sloučeny dohromady, aby mohly být v analýze zastoupeny kompletními 27-genovými sekvencemi.
    Hlavní atrakcí nové studie jsou ale samozřejmě retropozony. Haddrath a Baker použili jako výchozí bod genomové knihovny pro pštrosa dvouprstého (Struthio camelus), nandu Darwinova (Rhea/Pterocnemia pennata), kiviho Haastova (Apteryx haastii) a emu (Dromaius novaehollandiae). V těch našli a identifikovali stovky retropozonů z rodiny dlouhých vmezeřených elementů (LINEs) zvané "kuřecí repetice 1" (CR1). Ze sekvencí, které tyto retropozony lemují a které vznikly duplikací místa inzerce, autoři získali primery pro osekvenování homologických lokusů u ostatních paleognátů, od nichž genomové knihovny nebyly k dispozici. Některé další retropozony byly získány ze sekvencí emu dostupných v GenBanku a z přezkoumání datasetu Hackett et al. (2008). Haddrath s Bakerem zároveň nezapomněli ověřit přítomnost těchto retropozonů u kuřete a zebřičky pestré. Ve výsledku objevili 27 fylogeneticky informativních elementů, z nichž 6 sjednocuje paleognáty jako celek a 15 pomáhá rozkrýt příbuzenské vztahy mezi jejich jednotlivými liniemi.

Tato ilustrace je v podstatě uměleckým dílem: zachycuje evoluci paleognátů v jediném obrázku, shrnujícím fylogenezi, historickou biogeografii i data divergencí. Topologie stromu v sobě kombinuje údaje z 27-genového datasetu, který měl více znaků (31 685 párů bází), ale méně taxonů (jen jednoho moa, jednoho kivie, a třináct neognátů), a z 10-genového datasetu s méně znaky (9909 párů bází) a více taxony (tři moa, pět kiviů, patnáct neognátů) – ten první byl použit jako kostra, okolo níž byly doplněny taxony z druhého. Na výsledný strom potom autoři namapovali 27 retropozonů (šedé kuličky). Víme, že statisticky významnou podporu topologie představuje 3 a více retropozonů (Waddell et al. 2001), což znamená, že signifikantní podporu má monofylie nanduů, paleognátů – a nepštrosích paleognátů. Šedé vodorovné proužky reprezentují 95% intervaly nejvyšší posteriorní hustoty pro data příslušných divergencí, červené hodiny potom fosilní kalibrační body. Barevné vertikální proužky ukazují, kdy došlo k tektonickým událostem zachyceným na mapkách dole, tzn. kdy se z Gondwany vydělily pevniny obývané paleognáty (viz také obrysy kontinentů napravo od paleognátí části stromu). Pěkné obrázky ptáků pocházejí ze slavné série The Handbook of the Birds of the World. (Zdroj: Haddrath & Baker 2012: Figure 4)

3. Fylogenetika, rocks a clocks

    Důraz kladený na metodologii je rovněž působivý. Haddrath & Baker (2012) nejprve využili Bayesův faktor (viz zde), aby našli optimální rozdělení datasetu na oddíly – mezi zvažovanými variantami byl 1 oddíl (pro všech 10 genů), 3 oddíly (podle kodonové pozice), 10 oddílů (podle genu) či 30 oddílů (podle genu a kodonové pozice). Marginální věrohodnosti nebyly odhadovány pomocí harmonického průměru věrohodností z MCMC vzorku, což je problematický, avšak často využívaný postup (Ronquist & Deans 2010); nýbrž pomocí přesnější "stepping stone" metody, využívající sérii pravděpodobnostních rozdělení překlenujících mezeru mezi rozdělením priorním a posteriorním (Xie et al. 2011). Následně byly pro jednotlivé oddíly vybrány modely substituce pomocí Akaikeho informačního kritéria. A aby analýzu nesvedl na scestí konflikt mezi genovými stromy a druhovým stromem, nasadili Haddrath a Baker metodu maximální pseudo-věrohodnosti (Liu et al. 2010), která odhaduje druhový strom ze sady genových stromů a je statisticky konzistentní (= s rostoucím množstvím dat konverguje na správném výsledku) dokonce i v "anomální zóně" popsané Degnanem a Rosenbergem (2006; viz minulý článek). Maximální pseudo-věrohodnost je jen částečně parametrická metoda, takže ke správnému odhadu potřebuje víc dat než plně parametrické metody (Song et al. 2012) – jednu takovou, bayesovský odhad konkordančních faktorů, využili ke stejnému účelu ve své studii paleognátí fylogeneze Smith et al. (2012).
    Co se molekulárního datování týče, autoři použili techniku relaxovaných molekulárních hodin, která se snaží modelovat "tempo evoluce tempa evoluce" (Brown & van Tuinen 2011). Sesterské větve fylogenetického stromu v ní mohou vykazovat odlišné rychlosti evoluce, které ale korelují s tempem evoluce na větvi vedoucí k jejich společnému předkovi podle lognormálního rozdělení. Molekulární hodiny byly kalibrovány pomocí 7 "age constraints"; 2 kalibrační body byly externí (mimo ptáky), 5 bylo interních (v rámci ptáků). Dnešní bayesovské datovací metody konstruují okolo kalibračních bodů priorní pravděpodobnostní rozdělení, a přestože tvar i šířka těchto rozdělení mají obrovský vliv na výsledné datování, rigorózní protokol pro jejich navrhování prakticky neexistuje (Brown & van Tuinen 2011). Warnock et al. (2011) v obzvlášť depresivní ilustraci ukázali, jak odhadovaná data divergencí ovlivní změna v hodnotách parametrů μ a σ, které definují tvar a šířku lognormálního rozdělení určujícího hustotu priorní pravděpodobnosti pro stáří toho kterého uzlu v závislosti na tom, jak se navrhované stáří liší od stáří příslušné kalibrační fosilie – výsledné odchylky šly až do stovek milionů let. Metody k objektivnímu navrhování priorních rozdělení pro stáří divergencí se teprve začínají vynořovat, a jde o velice komplikované postupy využívající hyperpriory (Heath 2012).
    Není proto divu, že Haddrathova a Bakerova volba priorních rozdělení se zdá být poněkud arbitrární. Oddělení krokodýlí a ptačí linie popisuje normální (Gaussovo) rozdělení s dolní (243 Mya) i horní (251 Mya) hranicí – obě hranice jsou měkké (soft bounds), takže pravděpodnost, že pravý čas divergence leží mimo jimi vymezený interval je malá (5% celkové priorní hustoty pravděpodobnosti), ale nenulová. Normální rozdělení s 95% priorní hustoty† mezi měkkými hranicemi autoři využili i pro divergenci mezi aligátoří a kajmaní linií (66–71 Mya) a kasuárů od emu (25–35 Mya). Divergence kachnovitých od husovce (Anseranas) byla nastavena jako lognormální rozdělení bez horní hranice, zato však s tvrdým minimem na 67 Mya (= jakýkoli nižší odhad stáří obdrží nulovou priorní pravděpodobnost): z této doby pochází Vegavis, nejstarší známá kachna. Stejný postup byl použit i pro divergenci tučňáků od trubkonosých (minimum na 62 Mya – stáří taxonu Waimanu manneringi, nejstaršího známého tučňáka) a ostnákovitých od slučicovitých (minimum na 32 Mya – stáří taxonů Nupharanassa a Janipes, nejstarších známých ostnáků). Konečně odštěpení linií rorýsovitých a kolibříků bylo nastaveno na 47–49 Mya s tvrdým maximem na 53 Mya; tvar rozdělení zde neuvádí ani hlavní text studie, ani doplňková online data. Na stáří moderních ptáků (Neornithes) byl položen uniformní prior pro celý interval od 67 Ma (věk vegavise, nejstarší prokazatelně neornití fosilie) až do 133 Ma (tak starý je ptačí korunní klad podle datování založeného na mtDNA – viz např. Brown et al. 2008).

4. Hrozba tvrdé polytomie opět aktuální

    Bayesovská analýza 10 zřetězených genů potvrdila existenci všech dobře podpořených kladů (Palaeognathae, Neognathae, Galloanserae, Neoaves), a v rozporu s předběžnými výsledky, nahlášenými v abstraktu z roku 2010, silně podpořila monofylii nepštrosích paleognátů (posteriorní pravděpodobnost 1).
    Přijemným překvapením je nezávislá podpora pro sesterský vztah mezi tinamami a ptáky moa. Tento překvapivý svazek byl odhalen teprve předloni v analýze kompletních mitochondriálních genomů (Phillips et al. 2010); do té doby byli moa umisťování buď vedle kiviů, nebo na samou bázi "běžců". Worthy & Scofield (2012) se tento výsledek pokusili explicitně otestovat pomocí morfologických dat a zamítli jej. Celá studie byla ovšem v tomto ohledu zmatená; autoři se např. pokusili vynutit si po analýze výlučný klad (moa + tinamy), což jim ovšem nějakým záhadným způsobem nevyšlo, takže na výsledném stromě byli moa sesterskou skupinou všech ostatních "běžců" a tinamy stály mimo. Podivných a nepříliš logických výroků je plná i diskuze, v jednom však měli Worthy a Scofield pravdu: konflikt mezi mitochondriálními a morfologickými daty by měla rozřešit jaderná DNA. Sesterský vztah moa a tinam sice podpořila i kombinovaná analýza mitochondriálních a jaderných sekvencí, v ní však byli moa zastoupeni opět jen mitochondriálními daty (Harshman & Brown 2010). Nyní Haddrath a Baker tolik žádané jaderné geny ptáků moa konečně dodali, a výsledkem je opět robustní sesterský vztah vůči tinamám.

Paleognátí fylogeneze podle zřetězeného datasetu o 10 jaderných genech (vlevo) a jako konsenzus genových stromů, zrekonstruovaný metodou maximální pseudo-věrohodnosti (vpravo). Topologie je stejná s jedinou výjimkou: tinama koroptví (Nothoprocta perdicaria, Chilean tinamou) je na stromě vpravo blíže příbuzná tinamě argentinské (Eudromia elegans neboli elegant crested tinamou, na obrázcích chybně označována za "erect crested tinamou") než tinamě větší (Tinamus major, great tinamou) – tento výsledek se shoduje i s dosud nejdůkladnější fylogenetickou studií tinam (Bertelli & Porzecanski 2004), a proto jej lze považovat za důvěryhodnější. Jinak jsou rozdíly mezi oběma stromy především v podpoře jednotlivých větví. U stromu nalevo čísla nad větvemi reprezentují bayesovské posteriorní pravděpodobnosti (neoznačené uzly mají PP 1), u stromu vpravo jsou to hodnoty bootstrapu, který je obecně opatrnější (proto jsou čísla nižší). Protože pseudo-věrohodnostní analýza potřebuje zakořeněné genové stromy, byli do ní zahrnuti jen paleognáti zakořenění kuřecími sekvencemi – zarovnávání s krokodýlými sekvencemi bylo problematické. (Modifikováno z Haddrath & Baker 2012: Figure 1 a Figure 3)

    Jediným překvapením na 10-genovém stromě je tak nakonec pozice nanduů. Studie podporující "běžčí" polyfylii kladly tyto jihoamerické ptáky buď vedle tinam, nebo vedle kladu tvořeného tinamami, kasuárovitými a kivii (Harshman et al. 2008; Phillips et al. 2010; Smith et al. 2012). Na novém stromě však tvoří sesterskou skupinu kasuárovitých (kasuáři + emu), což je výsledek, který nelze brát vážně. Veškeré dosavadní molekulární fylogeneze, a to už od dob nepříliš sofistikovaných hybridizačních studií Sibleyho a Ahlquista, staví vedle kasuárovitých kivie – je přitom úplně jedno, jestli se díváme na mitochondrie (Haddrath & Baker 2001; Phillips et al. 2010) nebo jaderná data (Harshman et al. 2008; Smith et al. 2012), a určitou podporu má tento výsledek dokonce i ze strany morfologie (Bledsoe 1988; Johnston 2011). Autoři si to naštěstí uvědomují a poukazují na to, že větev vedoucí k tomuto uzlu je extrémně krátká, což poukazuje na možnost nekompletního třídění linií. Aby omezili riziko, že je za výsledek zodpovědný konflikt mezi genovými a druhovými stromy, projeli Haddrath a Baker dataset ještě výše zmíněnou pseudo-věrohodnostní metodou k odhadování druhových stromů. Topologie zůstala s výjimkou vztahů mezi třemi taxony tinam stejná, avšak hodnota bootstrapu pro bizarní uzel (nanduové + kasuárovití) činila už jen 30. Stejně drasticky ovšem poklesla i podpora pro klad nepštrosích paleognátů, pouze seskupení moa a tinam bylo vůči bootstrapu robustní (viz obrázek výše).
    27-genový dataset vrátil do stromu klad (kiviové + kasuárovití), podpořený dokonce posteriorní pravděpodobností 1. Nanduové jsou tentokrát tomuto kladu sesterskou skupinou, opět s PP = 1 – a to je vlastně problém daleko větší. V minulých článcích jsem se podrobně věnoval tomu, že dosavadní molekulární analýzy nebyly schopny ukázat, zda mají tinamy (resp. klad tinamy + moa) fylogeneticky blíž k nanduům, nebo ke kiviům a kasuárovitým. Smith et al. (2012) se poprvé důkladněji zamysleli nad možností, že by na tuto otázku jednoznačná odpověď ani nemusela existovat: báze nepštrosích paleognátů by totiž mohla být "tvrdou polytomií". Tak bývají označovány ty oblasti stromu, které z definice nelze rozřešit do dichotomických větvení – ancestrální populace v něm dala vzniknout více než dvěma dceřinným liniím téměř současně, v časovém intervalu tak krátkém, že v celém genomu není dost informací na to, aby šlo zrekonstruovat přesné pořadí větvení. Samotná existence tvrdých polytomií zůstává poněkud kontroverzní a jejich identifikace je ještě těžší: pokud se nám s určitým množstvím dat nějakou polytomii rozřešit povede, očividně nemohla být tvrdá, ovšem pokud se to nepovede, ještě to automaticky neznamená, že tvrdá je. Smith et al. (2012) nakonec existenci tvrdé polytomie u báze nepštrosích paleognátů zamítli s velice elegantním odůvodněním: kdyby tato hypotéza byla pravdivá, pak by veškeré podobnosti mezi genovými stromy byly pouze produktem náhody. Mohli bychom tedy očekávat, že všechny 3 možné příbuzenské vztahy mezi trojicí taxonů (moa + tinamy, kiviové + kasuárovití, nanduové) bude podporovat zhruba stejné množství genů. Jenže z jejich 40 jaderných lokusů vůbec žádný nepodporoval možnost, že by nanduové byli sesterskou skupinou kladu (kiviové + kasuáři), což lze se scénářem tvrdé polytomie skloubit jen velmi těžko.
    Nyní se ale ukazuje, že 27-genový dataset Haddratha a Bakera naopak tuto variantu podporuje velmi silně, s PP = 1. (Situace je pak o to zoufalejší, že většinu z těchto genů analyzovali už Harshman et al. [2008], a sesterský vztah tinam ke kladu tvořenému nanduy a australasijskými běžci jim z nich nevylezl – zato dvě zbývající topologie ano.) Co se pseudo-věrohodnostních druhových stromů týče, ten 27-genový má o něco vyšší bootstrapové hodnoty na velmi krátkých vnitřních větvích u báze nepštrosích paleognátů než ten 10-genový, které jsou však stále extrémně nízké oproti posteriorním pravděpodobnostem na stromě, který všech 27 genů zřetězil (jehož topologie je ovšem stejná; viz obrázek níže). Autoři konstatují, že k získání robustního druhového stromu, na kterém budou silně podpořené dokonce i extrémně krátké větve u báze nepštrosích paleognátů, bude potřeba ještě daleko více než 27 genů, což je ten samý závěr, který učinili i Smith et al. (2012). Otázkou ale je, zda je tato předpověď oprávněná. Jediný argument, proč by se v rámci paleognátních ptáků neměla nacházet tvrdá polytomie, totiž s Haddrathovou a Bakerovou studií padl.

Výsledky bayesovské analýzy zřetězených sekvencí (vlevo) a rekonstrukce druhového stromu z genových stromů pomocí maximální pseudo-věrohodnosti (vpravo), provedených nad 27-genovým datasetem s řidším taxon samplingem. Obě metody nyní podporují sesterský vztah tinamy koroptví a tinamy argentinské (přítomný jen v pseudo-věrohodnostní analýze 10-genového datasetu) a sesterský vztah nanduů k australasijským běžcům (který 10-genový dataset nevykryl vůbec). Podpora větví je vyjádřena stejně jako na obrázku výše. Větve pravého stromu, který explicitně bere v úvahu rozpory mezi jednotlivými stromy genovými, jsou opět daleko méně robustní než u stromu nalevo, avšak podpora pro nepštrosí paleognáty výrazně vzrostla. Překvapivé je, že podpora pro sesterský vztah nanduů a australasijských běžců, který tak silně zamítli Smith et al. (2012), je stejná (vlevo) nebo dokonce vyšší (vpravo) než pro naprosto nekontroverzní příbuzenský svazek kiviů a kasuárovitých. (Modifikováno z Haddrath & Baker 2012: Figure 2 a Figure 3)

    Dobrým ukazatelem rychlých evolučních radiací a nekompletního třídění linií (a potenciálně tedy i tvrdé polytomie) jsou konflikty mezi retropozony (Suh et al. 2011; Matzke et al. 2012). Haddrathovy a Bakerovy inzerce jsou však kongruentní mezi sebou, tak i se sekvenčními stromy. Pouze 2 inzerce nám však mají co říct k té oblasti stromu, která nás zajímá nejvíc – totiž ke vzájemným vztahům nanduů, tinam (+ ptáků moa) a australasijských běžců. Tyto 2 inzerce opět podporují klad (nanduové + kiviové + kasuárovití) vylučující tinamy, avšak tato podpora není statisticky významná. Waddell et al. (2001) pro tyto případy zformulovali úžasně jednoduché kritérium, které se vůbec nestará o to, jak moc nebo málo jsou retropozony homoplastické: pokud máme 3 možné topologie, pak jedna z nich musí být podpořena alespoň 3 inzercemi (a zbývající dvě žádnou podporu mít nesmějí), aby pravděpodobnost, že výskyt retropozonů odpovídá této topologii čistě náhodou, klesla pod žádoucích 5%. Je možné, že další retropozonové studie paleognátí fylogeneze (především ty, které budou mít k dispozici CR1 knihovnu pro tinamy) identifikují markery, které budou s těmi nynějšími v konfliktu – to by svědčilo o nekompletním třídění linií a rapidní radiaci u báze nepštrosích paleognátů, jejímž výsledkem by potenciálně mohla být i tvrdá polytomie. Pokud by naopak další studie našly další retropozony podporující nynější pozici nanduů, šlo by o velmi silný důkaz její správnosti. I Haddrath a Baker samotní přiznávají, že množství inzercí je na některých uzlech příliš malé na to, než aby šlo vyvozovat rozsáhlé závěry o absenci nekompletního třídění linií. Překvapivě slabá je např. i retropozonová podpora pro zcela nekontroverzní uzly typu kasuáři/emu nebo kiviové/kasuárovití (1 inzerce).

5. Molekulární hodiny: vikariance zpátky ve hře

    Znát absolutní časy divergence mezi jednotlivými vývojovými větvemi paleognátů je nezbytné pro testování hypotéz o jejich biogeografii. I kdyby pořadí těchto divergencí na rozpad Gondwany dokonale sedělo, když nebude odpovídat absolutní čas, pak je rozptyl přes oceán stále pravděpodobnější než vikariance kontinentálním driftem. Právě k tomuto závěru dospěli Phillips et al. (2010), a je zajímavé porovnat jejich výsledky s Haddrathem a Bakerem. Obě studie hlásí jednak optimální odhad, jednak 95% interval nejvyšší posteriorní hustoty, a pro oba údaje dávají dvě hodnoty: Phillips a spol. zkoušeli, jak výsledek změní přidání 2 interních kalibračních bodů, Haddrath a Baker zase porovnávají rozdíly mezi odhady z BEASTu a MCMCtree. Haddrath a Baker jsou daleko důkladnější a data divergencí odhadují pro všech 30 uzlů na svém stromě, zatímco Phillips et al. (2010) jen pro 6. Haddrath a Baker poukazují na to, že ačkoli BEAST i MCMCtree dávají prakticky tytéž bodové odhady, BEAST má daleko širší 95% intervaly. Krátké srovnání odhadů z obou studií:
  • Divergence pštros–zbytek paleognátů:
    • Phillips et al. (2010): optima 78 a 83 Ma, interval 55–104 Ma
    • Haddrath & Baker (2012): optima 97 Ma, interval 73–119 Ma
  • První divergence ne-pštrosích paleognátů: 
    • Phillips et al. (2010): optima 70 a 76 Ma, interval 50–98 Ma
    • Haddrath & Baker (2012): optima 81 a 84 Ma, interval 59–105 Ma
  • Divergence moa–tinamy:
    • Phillips et al. (2010): optima 53 a 60 Ma, interval 38–82 Ma
    • Haddrath & Baker (2012): optima 65 a 69 Ma, interval 47–87 Ma
  • Divergence kiviové–kasuárovití:
    • Phillips et al. (2010): optima 54 a 60 Ma, interval 37–83 Ma
    • Haddrath & Baker (2012): optima 73 a 78 Ma, interval 50–100 Ma
  • Divergence emu–kasuáři:
    • Phillips et al. (2010): optima 29 a 21 Ma, interval 8–51 Ma
    • Haddrath & Baker (2012): optima 29 a 27 Ma, interval 25–34 Ma
(První optimum Phillipse a spol. vždy odkazuje na odhad založený na interních i externích kalibracích, to druhé jen na externích. U Haddratha a Bakera první optimum údává údaj z BEASTu, to druhé z MCMCtree. Udaný je vždy ten nejširší z obou nahlášených intervalů – shodou okolností jak u Phillipse a spol., tak i u Haddratha a Bakera měl jeden z nahlášených intervalů spodní mez vždy nižší a zároveň horní mez vždy vyšší než ten druhý, takže nebylo třeba je kombinovat. U Phillipse a spol. byl širší interval založený jen na externích kalibracích, u Haddratha a Bakera ten z BEASTu. Druhý z bodů srovnání udává v obou analýzách něco jiného: u Phillipse a spol. divergenci nanduů od skupiny zahrnující tinamy, moa, kivie a kasuárovité; u Haddratha a Bakera divergenci tinam a moa od kiviů, kasuárovitých a nanduů.)

    Poslední společný předek všech žijících paleognátů měl existovat před 97 miliony let: v této době se od zbytku kladu odštěpili pštrosi. Autoři uvádějí, že dřívější studie kladly africké pštrosy do daleko odvozenější pozice, blízko australasijským běžcům (což je bias, daný konvergencí na stejném zastoupení bází v mtDNA – Phillips et al. 2010), a proto kladly jejich divergenci do doby daleko pozdější, na přelom křídy a paleogénu (66 Mya). K vysvětlení jejich nynějšího výskytu proto potřebovali kombinaci kontinentálního driftu a rozptylu (Cooper et al. 2001; Haddrath & Baker 2001). Je konec konců pravda, že fosilie pštrosů známe z afrických lokalit až po eurasijsko-africké faunální výměně na přelomu oligocénu a miocénu (Phillips et al. 2010). Nový odhad má ale časově blízko k oddělení Afriky z Gondwany, odhadovanému na 100 (Smith et al. 1994) až více než 110 (Maisey 2000) Ma: není to sice úplně přesně, ale do 95% intervalu se dokonce i nejvyšší hodnota pohodlně vejde. Haddrath a Baker proto konstatují, že rozptyl není k vysvětlení výskytu pštrosů potřeba; vikariance postačuje.
    U oddělení nanduů od australasijských běžců se dokonce setkáváme přesně s opačným problémem: odhadované datum divergence je příliš brzké na to, než aby za událost mohl být odpovědný kontinentální drift. Jižní Amerika byla s Austrálií skrze Antarktidu spojena ještě před 55 miliony let, zatímco linie nanduů se odštěpila před 76 (BEAST) nebo 81 (MCMCtree) miliony let. Bourdon et al. (2009) – morfologická studie, která odhalila klad složený z nanduů a kasuárovitých, až na absenci kiviů velmi podobný tomu ze současné studie – skutečně tuto divergenci interpretovala jako "a vicariance event that probably occurred in the earliest Tertiary". Přestože i Haddrath a Baker poznamenávají, že do spodní hranice širšího z obou 95% intervalů by se ještě odtržení Austrálie od antarkticko-jihoamerické pevniny vlezlo, raději geografii nanduů vysvětlují rozptylem.
    Kiviové se od kasuárovitých odštěpili před 73 či 78 miliony let, což jakž takž sedí na oddělení Nového Zélandu od pevninského celku zahrnujícího dnešní Austrálii, Antarktidu a Jižní Ameriku (před 82 miliony let, viz např. Barker 2011). Zde je tedy vikariance celkem přijatelná, a autoři si všímají, že blízko tohoto data se od zbytku paleognátů odštěpil i klad zahrnující moa a tinamy. Autoři proto spekulují, že společný předek moa, tinam, nanduů, kiviů a kasurárovitých se mohl ve svrchní křídě vyskytovat právě na Novém Zélandu – pak by nám stačily dvě disperzní události, totiž invaze nanduů do Jižní Ameriky někdy v kampánu a pozdější inveze tinam tamtéž v době okolo přelomu K/Pg. Vše ostatní by zvládla vysvětlit vikariance.
    Zatímco k úloze kontinentálního driftu je po čtyřiceti letech těžké říct něco nového, Haddrath a Baker zmiňují, že svůj otisk v paleognátí evoluci zanechaly i jiné geologické události. Diverzifikace kiviů do dnešních pěti rozeznatelných "druhů" (s několika dalšími výraznými "poddruhy") v posledních pěti milionech let např. koresponduje s obdobím, kdy byly na Novém Zélandě aktivní horotvorné procesy, a s cyklem dob ledových a meziledových. Oba jevy pravděpodobně vedly k fragmentaci areálů a usnadnily tím alopatrickou speciaci. Kiviové ovšem nejsou jediní novozélandští paleognáti, a ukazuje se, že diverzifikace ptáků moa (druhého nejrozmanitějšího paleognátího kladu hned po tinamách) musela mít jiné příčiny. Ve srovnání s předchozími studiemi založenými na mtDNA, které ji kladly do zhruba stejné doby jako radiaci kiviů (5,8 milionů let zpátky – Bunce et al. 2009), jaderná data kladou příslušnou divergence do daleko hlubší minulosti. Oddělení moa horského** (Megalapteryx didinus) od zbytku skupiny, což je zřejmě první divergence v rámci moa vůbec (Bourdon et a. 2009; Bunce et al. 2009), bylo odhadnuto na 21 (BEAST) či 19 (MCMCtree) Mya. Došlo k němu tedy několik milionů let po oligocénnímu zaplavení Nového Zélandu – většina pevniny se z pod vod opět vynořila asi před 23 miliony let. Autoři navrhují, že moa mohou být dalším příkladem jevu, kdy skupina nejprve projde "úzkým hrdlem láhve" v důsledku omezení areálu a následnou diverzifikací při jeho opětovné expanzi.
    V rámci neognátů, jejichž evoluce není hlavním tématem studie, vidíme také několik zajímavých výsledků. Jednak je jím datum divergence novozélandských pokřovníkovitých (Acanthisittidae), nejbazálnější žijící skupiny pěvců, od zbytku kladu (Eupasseres). To bylo dosud odhadováno na 82 Mya, čili datum oddělení Nového Zélandu od zbyku Gondwany (Barker et al. 2004; Barker 2011). Je pravda, že fosilie pro tuto oblast stromu téměř zcela chybí až do neogénu (Mayr 2009), ale jak konstatoval např. fylogenetický ornitolog Joseph Brown v komentáři na Google+, nemáme žádný důvod předpokládat, že evoluci pěvců (skupiny velmi dobrých letců, jejichž nejbližší příbuzní jsou opět schopnými letci) tvaroval kontinentální drift. S jaderným datasetem Haddratha a Bakera však MCMCtree odhadlo tuto divergenci na 51 a BEAST dokonce na pouhých 49 Mya, což se daleko lépe shoduje s fosilním záznamem. Nejstarší možní zástupci pěvčího korunního kladu jsou dokonce ještě o něco starší: proximální záprstí a distální tibiotarzus z australské raně eocénní lokality Tingamarra jsou staré asi 55 milionů let, dost možná však patří spíše do pěvčí kmenové linie než korunního kladu (Mayr 2009). První jednoznačně moderní pěvci pocházejí z oligocénu, což se s novým molekulárním datováním dobře shoduje. Druhým případem, kde přechod k jaderným genům odstranil neshody mezi molekulárními hodinami a fosilním záznamem, jsou tučňáci. Fosilní záznam této skupiny je dobře prozkoumaný (Ksepka & Ando 2011; viz i článek na blogu) a fosilních tučňáků známe víc než těch žijících. Většina této rozmanitosti se však soustředí v kmenové linii; nejstarší fosilie prokazatelných zástupců tučňáčího korunního kladu pocházejí teprve ze středního až pozdního miocénu, tj. z doby asi před 11 až 13 miliony let (Ksepka & Ando 2011). Proto byly molekulární odhady stáří tučňáčího korunního kladu, šplhající až k 41 milionům let (Baker et al. 2006), krajně nevěrohodné. Nově ale vycházejí na krásných 13 či 14 milionů let (s 95% intervalem nejvyšší posteriorní hustoty v MCMCtree od 7 do 22 Ma), což na fosilní záznam sedí naprosto přesně – dokonce lépe, že čekali sami paleontologové. Ksepka & Ando (2011) např. označili za pravděpodobné, že skutečná hodnota leží někde mezi oběma extrémy (tj. 11 a 41 Ma).

6. Stáří Neornithes: staré rány znovu otevřeny (kde "staré rány" = 4 roky staré rány)

    Pravděpodobně největší kontroverzí celého molekulárního datování ptačí evoluce je ale stáří moderních ptáků jako celku (Neornithes), resp. to, zda jejich explozivní diverzifikace, jejíž stopy dodnes vidíme v konfliktních genových stromech (Chojnowski et al. 2008) a retropozonových markerech (Suh et al. 2011; Matzke et al. 2012), proběhla ještě před, nebo až po vymření neptačích dinosaurů na rozhraní křídy a paleogénu. Je známo, že druhohorní fosilie přiřaditelné moderním ptačím skupinám jsou extrémně vzácné (viz např. Hope 2002), ale Vegavis, který v tomto ohledu zaujímá zcela unikátní postavení, už je zase tak odvozený a hluboce usazený v ptačím korunním kladu (fylogeneticky má ke kachně divoké blíž než husovec nebo kamišovití), že skutečně implikuje dlouhou předchozí evoluci, jež je nám ve fosilním záznamu skryta. Molekulární hodiny založené na mtDNA kladly vznik moderních ptáků – divergenci mezi paleognáty a neognáty – do spodní křídy, asi 135 milionů let zpátky (Brown et al. 2008). Prakticky všechny moderní ptačí "řády" podle nich vznikly už ve svrchní křídě, a rozhraním K/Pg tak mělo projít minimálně 37 samostaných ptačích linií. Ericson et al. (2006) sice kvůli problémům se zarovnáváním paleognátích a neognátích sekvencí nebyli schopni věrohodně odhadnout datum vzniku Neornithes, ale ukázali, že důkladná fosilní kalibrace opět klade evoluční radiaci u báze Neoaves (neognátních ptáků mimo hrabavých a vrubozobých) do třetihor, tedy tam, kde ji paleontologové původně očekávali. Ukázalo se ale, že použitý algoritmus ("rate smoothing", uhlazování tempa evoluce) není příliš spolehlivý a zkresluje výsledky směrem k mladším datacím.
    Očekávalo se však, že přechod k jaderným sekvencím, které se vyvíjejí pomaleji než anomální "superlokus" mitochondriálního genomu, tyto drastické rozdíly mezi molekulárními hodinami a fosilním záznamem trochu srovná (Brown & van Tuinen 2011). Ohromný pokrok v tomto směru učinila jediná publikace: do loňských Living Dinosaurs byly zařazeny příspěvky hned několika paleontologů i molekulárních fylogenetiků, které se vůbec poprvé jakž takž shodly na nějaké časové ose pro ptačí evoluci. Joseph Brown, na nějž už jsem výše odkazoval, zde představil výsledky své dosud nepublikované analýzy dosud největšího jaderného datasetu (Hackett et al. 2008) jedním z nejspolehlivějších datovacích programů (BEAST), které sice opět zahrnovaly pozdněkřídovou radiaci Neoaves, ale stáří Neornithes už kleslo na nějakých 100 milionů let (Brown & van Tuinen 2011). To je někde "na půl cesty" mezi věkem vegavise (asi 67 milionů let) a odhady odvozenými z mtDNA – už nemusíme předpokládat, že plná polovina evoluce moderních ptáků se odehrála bez toho, aniž by zanechala jedinou stopu ve fosilním záznamu.
    Jenže Haddrath a Baker ukazují, že přinejmenším některé jaderné geny nejenže stáří kladů odvozená z mtDNA nesníží, ale naopak je ještě silně podporují. BEAST odhadl stáří divergence mezi paleognáty a neognáty na 127 milionů let (s 95% intervalem od 114 do 133 milionů let) a MCMCtree dokonce na 131 milionů let (95% interval 122–138 Ma). Autoři se tyto výsledky snaží obhájit poukazováním na odvozenost vegavise a na skutečnost, že rané fáze evoluce moderních ptáků se odehrávaly na jižní polokouli, odkuď nemáme dostatek fosilních lokalit na to, abychom mohli činit nějaké dalekosáhlé závěry. Citováni jsou i Brocklehurst et al. (2012), kteří nedávno ukázali, že svcrhnokřídový fosilní záznam ptáků je tak slabý, že existence moderních linií v této době nemůže být vyloučena. (Jde mimochodem asi o nejvýznamnější studii v tomto roce, o níž jsem se nepřinutil na blog napsat.) Haddrathovy a Bakerovy argumenty nejsou špatné a do jisté míry jsem ochoten je přijmout – svrchnokřídovou radiaci neoavianů, kterou Haddrathova a Bakerova data také podporují, beru za prokázanou. Žádný sampling bias mě však nedokáže přesvědčit o tom, že se v neprozkoumaných fosilních lokalitách jižní polokoule skrývá celá první půlka evoluce moderních ptáků.

7. Acknowledgments

    Děkuji Alexanderu Suhovi za to, že mě odkázal na Bakerův a Haddrathův abstrakt ve sborníku z IOC a že zodpověděl mé otázky o ptačích retropozonech.


*Pojmem "molekulární hodiny" rozumím datování uzlů na molekulárně-fylogenetických stromech pomocí fosilních kalibrací, nikoli předpoklad, že molekulární evoluce probíhá u všech vývojových větví stejnou rychlostí – přestože to druhé samozřejmě stálo u počátků toho prvního.

**V nejlepší tradici českého ornitologického názvosloví jsem si pro taxony, o nichž se až dosud česky mluvit nemohlo, nějaká česká jména prostě vymyslel, takže už se o nich mluvit může. (Hurá!) Abych si ale nepřivlastňoval přehnané zásluhy, můj "moa křovinný" i "moa horský" jsou doslovné překlady z anglických předloh ("little bush moa", "upland moa"). Omlouvá mě snad jen to, že oficiální české názvosloví ptáků bylo mnohdy vytvářeno úplně stejně.

***S kombinováním obou datasetů to ale vůbec bylo komplikované. Hackett et al. (2008) zařadili do analýzy 19 genů, Harshman et al. (2008) jich měli 20; 18 z nich se mezi oběma datasety shodovalo. 1 z nich už byl obsažen v 10-genovém datasetu Haddratha a Bakera (to jsme tedy na 27 genech pro kombinovaný dataset) a 2 další nemohly být osekvenovány pro moa (25 genů). Autoři ale přidali 1 gen, který měli Harshman a spol. ale Hackett a spol. ne (26 genů), a ke konečnému číslu 27 se dostali tím, že dvě části beta-fibrigenu (intron 4 a introny 6 a 7) započítali jako 2 samostatné lokusy.

†Pojmy "prior" a "posterior" z bayesovské statistiky jsou do češtiny obyčejně překládány jako "apriorní" a "aposteriorní". Google ale najde i výrazy typu "priorní pravděpodobnost" nebo "posteriorní pravděpodobnost", a to až podezřele často v biologických textech, jejichž autoři zřejmě česky psanou statistickou literaturu nečtou. Snad i proto už tyto alternativní překlady nenajdeme ve spojeních "(a)priorní rozdělení" nebo "(a)posteriorní hustota pravděpodobnosti", já je ovšem ze solidarity s biology používám i tam. Krom toho, i čeští bayesovci mluví o priorech, ne o "apriorech".

Zdroje: