1. Co jsou retropozony a k čemu jsou dobré
O retropozonech jsem na blogu už dvakrát psal v souvislosti s fylogenetikou žijících ptáků. Jde o podtřídu elementů známých jako "skákající geny" (formálně transpozibilní elementy) a i přes minuciózní rozlišování mezi retropozony a retrotranspozony, které někteří autoři obhajují, sem lze zahrnout všechny DNA sekvence, které vznikly reverzní transkripcí mRNA (Zhang et al. 2005). Paradoxní je, že retropozony nikam neskáčou: mohou genom pouze zaplavovat svými kopiemi, nemají ale transpozázu, která by jim umožnila vyříznout se z aktuální pozice a vklouznout jinam. Některé z elementů řazených do této kategorie si umí reverzní transkriptázu kódovat samy: sem spadají třeba LINEs, dlouhé vmezeřené elementy, které zahrnují i tzv. podrodinu CR1 (Chicken Repeats 1), jedny z vůbec nejčastějších ptačích retropozonů. Totéž platí i pro pozůstatky endogenních retrovirů, které ztratily svou infekční schopnost: takovými retropozony jsou LTRs, dlouhé koncové repetice (Ray 2007). Některé elementy z této kategorie ovšem neumějí kódovat ani funkční reverzní transkriptázu a při svém šíření se tak musí spoléhat na jiné skákající geny: to je případ SINEs, krátkých vmezeřených elementů, které se ukázaly být užitečným nástrojem při zkoumání fylogenetických vztahů mezi savci, avšak u ptáků se prakticky nevyskytují.
O retropozonech jsem na blogu už dvakrát psal v souvislosti s fylogenetikou žijících ptáků. Jde o podtřídu elementů známých jako "skákající geny" (formálně transpozibilní elementy) a i přes minuciózní rozlišování mezi retropozony a retrotranspozony, které někteří autoři obhajují, sem lze zahrnout všechny DNA sekvence, které vznikly reverzní transkripcí mRNA (Zhang et al. 2005). Paradoxní je, že retropozony nikam neskáčou: mohou genom pouze zaplavovat svými kopiemi, nemají ale transpozázu, která by jim umožnila vyříznout se z aktuální pozice a vklouznout jinam. Některé z elementů řazených do této kategorie si umí reverzní transkriptázu kódovat samy: sem spadají třeba LINEs, dlouhé vmezeřené elementy, které zahrnují i tzv. podrodinu CR1 (Chicken Repeats 1), jedny z vůbec nejčastějších ptačích retropozonů. Totéž platí i pro pozůstatky endogenních retrovirů, které ztratily svou infekční schopnost: takovými retropozony jsou LTRs, dlouhé koncové repetice (Ray 2007). Některé elementy z této kategorie ovšem neumějí kódovat ani funkční reverzní transkriptázu a při svém šíření se tak musí spoléhat na jiné skákající geny: to je případ SINEs, krátkých vmezeřených elementů, které se ukázaly být užitečným nástrojem při zkoumání fylogenetických vztahů mezi savci, avšak u ptáků se prakticky nevyskytují.
Jednou z nejzajímavějších věcí na retropozonech je skutečnost, že vložení každého elementu do genomu provází duplikace cílového místa, přičemž takto vzniklé duplikáty integrovaný retropozon z obou stran olemují (tzv. flanking sequences). Jde o sekvence o délce až stovek nukleotidů a právě díky nim (resp. jejich vysoce konzervovaným regionům) můžeme retropozony identifikovat, a to i velmi, velmi dlouho po samotné inzerci. Waddell et al. (2001) odhadují, že uplyne 250 milionů let, než doklady po inzerci savčího SINE zcela smažou náhodné mutace, a i konzervativnější odhady retropozonům dávají hodně přes 100 milionů let. S takovými časovými intervaly lze nejstarší retropozony bez nadsázky označit za molekulární fosilie, které se z genomu odkrývají právě tak, jako kosti z horniny. Inzerce retropozonů však nejsou něčím, co by se dělo jen daleko v minulosti – dochází k nim jistým tempem neustále. Najdeme-li inzerci tak mladou, že alela, která ji nese, se ještě nestačila zafixovat v populaci (jinak řečeno, v genofondu vedle sebe prozatím koexistuje alela s retropozonem a alela bez retropozonu), může nám toho říct mnoho zajímavého o genetického toku, populační substruktuře, genetické diverzitě nebo míře inbreedingu (Ray 2007). Staré inzerce naopak mohou představovat téměř ideální evidenci o příbuzenských vztazích mezi taxony, a můžeme tak očekávat, že retropozony budou hrát význačnou úlohu v tom, co Joe Felsenstein nazývá "Grand Reunion" – syntézu fylogenetiky a populační genetiky.
2. Retropozony ve fylogenetice
K fylogenetické analýze retropozonů stačí většinou obyčejná parsimonie. Evoluce retropozonů je totiž oproti evoluci nukleotidů docela nudná, takže nepotřebujeme všechny ty složité modely s gama-distribuovanou variací v tempu evoluce, proporcemi invariantních pozic atd. Přesto se už objevily návrhy, jak ji modelovat a vyrovnat se s některými z jejich zvláštností: retropozony by se např. mohly do některých lokusů integrovat častěji než do jiných (Han et al. 2011), náhodné mutace by je mohly u různých taxonů zahlazovat různými rychlostmi (Waddell et al. 2001), a inzerce pocházející z multiplikace stejného retropozonu nemají nezávislý výskyt (Miyamoto 1999). Přesto parsimonie i přes své četné chyby (viz zde, zde) stačí, neboť retropozony nejsou jen tak obyčejné znaky. Steel & Penny (2000) ukázali, že mohou-li znaky nabývat dostatečně mnoha stavů, bude parsimonie statisticky konzistentní (= s více daty se bude blížit správnému stromu) pro všechny možné kombinace parametrů – vyhne se tedy i nechvalně proslulému přitahování dlouhých větví ve Felsensteinově zóně. Otázkou je, kolik je "dostatečně mnoho": 4 stavy, které používá většina sekvenčních analýz, rozhodně nestačí, jelikož přitahování dlouhých větví v nich pozorujeme docela běžné. Ale při integraci do ptačího genomu mohou retropozony vklouznout do téměř kterékoli z 1,2 miliard možných pozic, z nichž každá představuje samostatný znakový stav (Matzke et al. 2012). Výjimečnosti retropozonů si v tomto ohledu povšimli jak Steel & Penny (2000), tak Sober (2004) – druhá práce dokonce předem varuje, že při diskuzi o kladech a záporech parsimonie a věrohodnosti bude retropozonové inzerce ignorovat, jelikož obvyklé poučky zde ztrácejí význam. Díky tomu je oprávněné říct, že parsimonie nad retropozonovými daty má stejné vlastnosti jako spolehlivější věrohodnost (Suh et al. 2011a; Matzke et al. 2012).
Rozbory retropozonových inzercí představují alternativní přístup, jak z DNA dostat fylogeneticky cenné informace. Běžné analýzy, které kódují každý jednotlivý nukleotid samostatně, mají mnohé výhody – téměř neomezený počet znaků s jasně definovanými stavy –, ale také mnoho problémů. Fylogenetický signál může zcela smazat saturace (jev, který nastává, pokud nukleotidová pozice prodělala vícero mutací, než dospěla k nyní pozorovanému stavu), zvláště u rychle se vyvíjejících třetích pozic kodonů; homoplazie v kombinaci s odlišnými rychlostmi evoluce vede k přitahování dlouhých větví, které může svést na scestí každou fylogenetickou metodu (byť některé jsou schopny tuto chybu s více daty napravit); a rizikem je i base composition bias, tedy shlukování taxonů s podobným poměrným zastoupením jednotlivých bází v genomu bez ohledu na reálné příbuzenství.
Ani jedním z těchto problémů retropozony netrpí. Možnost klasické homoplazie je zde totiž velice omezená: znamenala by buď přesné vyříznutí, nebo nezávislou inzerci stejného typu se stejným zkrácením* a stejnou orientací na totéž místo v genomu. Může se to stát? Ano, může: ukázalo se, že genom má k dispozici mechanizmus pro přesné vystřižení (van de Lagemaat et al. 2005) a že i k paralelní inzerci občas dojde (u ptáků se to zřejmě stalo u sluk a datlů – Han et al. 2011), a nakonec snad přece jen existují tzv. "hot spots", místa, kam se retropozony integrují častěji než jinam (Han et al. 2011). Všechny studie, které se těmito problémy zabývaly, ale došly k závěru, že tyto jevy jsou stále velmi vzácné a nedochází k nim dost často na to, aby představovaly závažný problém (van de Lagemaat et al. 2005; Ray et al. 2006; Ray 2007) – dokonce i Han et al. (2011), kteří toho kolem celé otázky nadělali nejvíc, nakonec uznali, že "TE insertions retain a strong phylogenetic signal and [...] exhibit very little homoplasy" (p. 283), a to navíc jejich metody Matzke et al. (2012) označili za zavádějící a vůči retropozonům neférově tvrdé. Problémy typu přitahování dlouhých větví tedy zcela odpadají. Nemáme navíc důvod předpokládat, že nezávislé inzerce nebo přesné delece dvakrát způsobí přesně ten samý nepravdivý vzorec výskytu. Zdálo by se tedy, že cokoli víc než jedna inzerce se rovná železné jistotě. Waddell et al. (2001) problém uchopili jinak, z hlediska striktně statistického, a zformulovali kritérium ještě tvrdší: k zamítnutí nulové hypotézy jsou třeba aspoň 3 inzerce bez jakéhokoli konfliktního signálu.
Jediným z velkých problémů sekvenčních dat, kterého se nezbavíme ani u retropozonů, je hemiplazie. Ačkoli stejně jako běžná homoplazie vytváří konfliktní vzorce výskytu znaků, její mechanizmus je odlišný. Je důsledkem jevu známého jako nekompletní třídění linií, který nastává, pokud se ancestrální populace začala štěpit ještě předtím, než se v ní ustálil původní polymorfizmus. Evoluční linie vzešlé z tohoto štěpení zdědí všechny alely obsažené v genofondu původní populace, které se poté zafixují zcela náhodně. O nekompletním třídění linií mluvíme tehdy, když strom sestavený z alel na polymorfickém lokusu (gene tree) nesouhlasí s průběhem fylogeneze (species tree). Často se objevuje při velkých evolučních radiacích, k jaké došlo např. u báze placentálních savců. Právě zde se retropozonové stromy sekly, když Nishihara et al. (2006) odhalili silnou podporu pro klad zahrnující letouny, lichokopytníky, šelmy a luskouny, geniálně pojmenovaný jako Pegasoferae**. Ač podpořen 4 inzercemi, největší sekvenční studie jeho existenci zamítají (Zhou et al. 2011; Meredith et al. 2011). Zároveň jde však o pěknou ukázku toho, že pokud se nám pod rukama plete nekompletní třídění linií, většinou to poznáme: není to totiž tak, že by se všechny genové stromy spikly a společně odporovaly "species tree"; odporují i sobě navzájem. Už Nishihara a spol. si všimli jedné inzerce, jejíž výskyt se s Pegasoferae neslučuje, zato však odpovídá výsledkům sekvenčních analýz. Navíc i samotný výskyt hemiplazie může říct leccos zajímavého o evoluční historii skupiny (Matzke et al. 2012).
*Zkrácení (truncation) poukazuje na skutečnost, že většina inzercí zahrnuje pouze část originální RNA šablony. Důvodem je neúplná reverzní transkripce, která často "vynechává" hlavně u 5' konce původní sekvence (Volff et al. 2001; Han et al. 2011).
**Smím-li citovat z komentáře Mike'a Keeseyho na DML:
Vzhledem k těmto vlastnostem jsou retropozony ideálním nástrojem k nezávislému ověření výsledků sekvenčních analýz. Důležité je zde slovo "nezávislému": není třeba se bát, že sekvenční a retropozonové rozbory využívají dvakrát ta samá data. Ačkoli sekvenční analýza např. jaderných intronů na nějaký ten retropozon pravděpodobně narazí, pořád s ním bude zacházet jen jako s posloupností nezávisle se vyvíjejících nukleotidů. To není špatně: jakmile se retropozon jednou začlení do DNA, skutečně prodělává ty samé náhodné mutace jako každá jiná nekódující DNA; samotná inzerce však představuje proces zcela odlišný. Retropozonová analýza se stará právě jen o tento druhý proces: dokud lze rozpoznat, o jaký typ elementu jde, nejsou bodové mutace v jeho sekvenci důležité. Retropozon zde není kódován jako několik stovek znaků o 4 stavech s nejasnou polaritou, ale jako znak jediný, který se navíc polarizuje zcela sám, bez potřeby nějaké outgroup, takže odvozený stav (přítomnost inzerce) lze od primitivního stavu (absence inzerce) odlišit automaticky.
Vzhledem k tomu, jak problematické jsou vzájemné příbuzenské vztahy žijících ptáků, není divu, že své naděje do retropozonů začínají vkládat i ornitologové (Livezey 2011; Mayr 2011). První analýzy tohoto typu zde však nastoupily až s určitým zpožděním oproti savcům, a přestože průkopnické studie jsou staré už přes pět let (Watanabe et al. 2006; Kriegs et al. 2007), více se v tomto směru začalo podnikat až zcela nedávno (Suh et al. 2011a; Matzke et al. 2012; Liu et al. 2012). Jednoznačně nejvýznamnější ze všech dosud provedených retropozonových analýz ptáků pak loni publikovali Suh et al. (2011b), jejichž strom přinesl podporu pro nečekaně mnoho skupin již dříve vzešlých z analýz velkého množství sekvenčních dat. Šlo např. o klady Psittacopasserae (složený z papoušků a pěvců) a Eufalconimorphae (papoušci, pěvci, sokoli).
Zároveň šlo však o ukázku problému, který nedávno zmínil John Harshman v komentáři na Tetrapod Zoology. Retropozonové studie musí být zaměřeny na nějakou konkrétní skupinu či aspoň posloupnost uzlů na kladogramu. Chceme-li znát fylogenetickou pozici pěvců, je nutné zkoumat inzerce sdílené s pěvci. A zatímco analýza takových inzercí dokáže určit relativní fylogenetickou vzdálenost různých skupin od pěvců (papoušci k nim mají nejblíž, sokolovití dál, seriemy ještě dál atd.), vzájemné příbuzenské vztahy čehokoli, co leží mimo tuto páteřní linii – třeba ptáků, kteří tvoří společně samostatný klad a pěvcům jsou tedy vzdálení všichni úplně stejně –, ověřit nemůže. Proto ty rozsáhlé polytomie ve výsledném kladogramu, ve kterých se zcela rozpustila i některá dobře známá a nijak kontroverzní seskupení, jako např. Picocoraciae (šplhavci + "srostloprstí") nebo Strisores (svišťouni + "lelkové"). Není divu: k tomu by byla třeba celá nová sada informativních inzercí, a k tomu je dobré mít osekvenovaný kompletní genom. Ten je zatím k dispozici jen pro kuře (Gallus gallus) a zebřičku pestrou (Taeniopygia guttata) – jenže co když chceme znát příbuzenské vztahy nějakých jiných ptáků?
3. Suh et al. 2012
Právě na tuto otázku se snaží odpovědět nová studie Alexandera Suha a kolektivu, která byla měsíc zpátky přijata pro publikaci v žurnálu Molecular Biology and Evolution. Autoři připomínají, že ačkoli některé studie zkoumaly retropozony i u ptáků, pro něž ještě není kompletní genom k dispozici (např. Watanabe et al. [2006] u tučňáků), vždy se jednalo jen o několik inzercí, které by rozhodně nestačily k provedení tak rozsáhlé studie, jakou publikovali Suh et al. (2011b). K tomu je potřeba buď získat nové úplné genomy, nebo vynalézt metodu, která dovede retropozony z genomu cíleně vytáhnout. Autoři takovou metodu představili a ihned ji také vyzkoušeli k otestování sesterského vztahu potápek a plameňáků, jedné z nejpozoruhodnějších fylogenetických hypotéz, které se v poslední době u ptáků vyskytly.
3.1 Extrakce retropozonů a fylogenetická analýza
Suh et al. (2012) upravili protokol, který Wang & Kirkness (2005) vytvořili pro populačně-genetickou studii psů založenou na krátkých vmezeřených elementech (SINEs). Jaderná DNA se naštěpí pomocí restrikčního enzymu a podrobí se inverzní polymerázové řetězové reakci (PCR), která jako primery – tedy počáteční místa pro syntézu DNA – používá sekvence typické pro retropozony z rodiny CR1. Elementy z této skupiny tvoří velkou část retropozonů přítomných v ptačím genomu: spolu s dlouhými koncovými repeticemi (LTRs) přes 97% (Suh et al. 2011b). Inverzní PCR umožňuje amplifikaci (tj. zmnožení) i takových úseků DNA, jejichž přesnou sekvenci neznáme, za podmínky, že jsou z obou stran ohraničeny známými sekvencemi (které jsou doplňkové k primerům). Naštěpené fragmenty se při ní nejprve pomocí speciálního enzymu převedou do kruhové formy, která v sobě obsahuje jak známou sekvenci, tak i neznámý úsek, o jehož amplifikaci usilujeme. Následně je aplikován další restrikční enzym, který kruhovou molekulu rozstřihne a znovu ji tak převede do lineární podoby – a protože stříhá uvnitř známé sekvence, nová lineární forma bude obsahovat neznámý fragment ohraničený z obou stran známými sekvencemi, tedy přesně to, čeho jsme se snažili dosáhnout. Na tuto novou lineární molekulu už je pak možné aplikovat běžnou polymerázovou řetězovou reakci. Tímto postupem Suh et al. (2012) vytvořili genomovou knihovnu: soubor mnoha klonovatelných fragmentů DNA (v tomto případě obsahujících CR1 retropozony). Po naklonování a osekvenování už nic nic nebrání tomu, aby se nalezené inzerce využily ve fylogenetické analýze.
Ukázková studie byla provedena na potápce malé (Tachybaptus ruficollis). Z genomové knihovny sestavené podle výše uvedené procedury Suh et al. (2012) náhodně vybrali 180 klonů fragmentů obsahujících CR1 retropozony a pomocí programu pro zarovnávání (alignment) DNA sekvencí hledali shodu v genomech kuřete a zebřičky. Pokud najde dostatečně vysoký stupeň shody, rozšíří se hledání v obou směrech o další 2 kilobáze. Následuje osekvenování a zarovnání. Pak už nic nebrání tomu, aby byla aplikována přísná kritéria pro identifikaci kandidátních lokusů, která do detailu popsali už Suh et al. (2011b): vhodné jsou jen retropozony z vysoce konzervovaných intronů nebo mezigenových oblastí kratších než 1,5 kilobáze. Těmito požadavky prošlo jen 38 lokusů z původních 180, z nichž dva navíc obsahovaly pouze inzerci sdílenou mezi potápkou a zebřičkou. Jelikož linie vedoucí k zebřičce se už detailní analýzy dočkala (Suh et al. 2011b), autoři tyto dva lokusy vyřadili z další analýzy. Zarovnané sekvence potápky, kuřete a zebřičky se prohledají na zakonzervované oblasti, tedy místa, kde všechny tři genomy vykazují stejnou nebo aspoň velmi podobnou sekvenci. K této sekvenci se vytvoří komplementární primer pro polymerázovou řetězovou reakci. Potřeba je však ještě druhý primer, který ale nemůže být vytvořen na základě stejného postupu: klon fragmentu z genomu potápky obsahuje jen jednu z obou "flanking sequences". Druhý primer je tedy vytvořen čistě na základě předpokladu, že co je stejné u kuřete a zebřičky, bude stejné i u potápek. To je předpoklad docela rozumný (potápky patří do Neognathae, což znamená, že jsou potomky posledního společného předka kuřete a zebřičky), ale občas se samozřejmě sekne: v takových případech navrhují Suh a spol. vytvořit několik alternativních primerů, aby se zvýšila šance dosáhnout s PCR úspěšných výsledků. V tomto konkrétním případě se povedlo najít 15 markerů, které bylo možné osekvenovat napříč taxonomickým vzorkem.
Z nich Suh et al. (2012) sestavili datovou matrici, v níž je přítomnost retropozonu kódována jako "+" a absence jako "–". Jako OTUs byly použity tři taxony potápek a dvě jejich potenciální sesterské zástupci skupiny. Tou první jsou plameňáci, které v sesterské pozici vůči potápkám odhalují téměř všechna známá data krom některých morfologických znaků (viz níže). Ty jako sesterskou skupinu potápek identifikují morfologicky i ekologicky, pravda, daleko podobnější potáplice (Livezey & Zusi 2007). Daleko zajímavějším fylogenetickým problémem je nicméně hledání sesterské skupiny k celému kladu Mirandornithes, jak skupinu sestávající z potápek a plameňáků pojmenoval Sangster (2005). Brown et al. (2008) a Morgan-Richards et al. (2008) na této pozici odkryli dlouhokřídlé. Obě studie byly založeny na datech z mitochondriální DNA a měly podstatné nedostatky: ta první použila velice rozsáhlý taxonomický vzorek (135 taxonů), ale nekompletní mtDNA sekvence; zatímco ta druhá analyzovala kompletní mt-genomy, avšak u daleko menšího počtu taxonů. Pacheco et al. (2011), kteří zkombinovali to nejlepší z obou studií, přinesli spíše rozporuplné výsledky: v první z dílčích analýz byli sesterským taxonem Mirandornithes opět dlouhokřídlí, ovšem v kombinaci s holuby; v té druhé pak skupina složená z "brodivých", "veslonohých", tučňáků, trubkonosých, potáplic a zcela bizarně i potuů (Nyctibiidae). (Mayr [2011] takové uskupení nazval Aequornithes, potuovité ale v souladu s daty z morfologie i jaderné DNA řadil úplně jinam.) S holuby – resp. s kladem sestávajícím z holubů, mesitů, stepokurů a faetonů – dala mirandornity dohromady také dosud největší studie jaderné DNA (Hackett et al. 2008). Aby otestovali co nejvíce z těchto hypotéz, zařadili Suh et al. (2012) do svého rozboru potáplici, racka a holuba. Škoda je snad jen vynechání mesitů, které coby sesterskou skupinu Mirandornithes ve své vynikající revizi ptačí fylogenetiky navrhl Mayr (2011).
3.2 Evoluce retropozonů
Autoři dělí 15 prozkoumaných inzercí do 4 podrodin podle toho, v jakém období byly aktivní, což koresponduje s tím, na jakém uzlu je odkrývá fylogenetická analýza. Dvě z nich se nacházejí u potápek a plameňáků, avšak u žádného jiného ze zkoumaných ptáků – další důkaz toho, že hypotéza o blízkém příbuzenství potápek a potáplic je chybná a založená pouze na konvergentních podobnostech, vyplývajících ze shodného způsobu plavání pomocí zadních končetin. Podpořena je tím naopak existence kladu Mirandornithes a Mayrovo tvrzení, že sesterský vztah mezi plameňáky a potápkami představuje jeden z nejlépe podložených "kladů vyšší úrovně" v rámci moderních ptáků (Mayr 2004). Jak na DML podotkl David Marjanović, zdá se, že jeden z nejlépe podložených kladů může být klidně přehlížen skoro 250 let: systematiky nikdy nenapadl, dokud jej neodkryli van Tuinen et al. (2001) s kombinovanou analýzou jaderné a mitochondriální DNA. Podpora pro toto seskupení začala rychle vzrůstat, a to jak díky molekulám (Brown et al. 2008; Hackett et al. 2008; Morgan-Richards et al. 2008; Pacheco et al. 2011), tak i dlouho nedoceněným morfologickým datům (Mayr 2004; Manegold 2006), paleontologii (Mayr 2007) nebo parazitologii (Johnson et al. 2006). Nyní se přidávají i retropozony.
Ze zbylých 13 retropozonů se 3 vyskytují u všech zahrnutých potápek, čímž (statisticky významně) podporují monofylii kladu Podicipediformes. 5 dalších inzercí potvrzuje monofylii kladu Tachybaptus, který zahrnuje jak potápku malou, tak i potápku australskou, v souladu s uznávanou taxonomií potápek (Fjeldså 2004). A konečně posledních pět markerů je autapomorfických pro potápku malou či dokonce nějakou její konkrétní populaci. Jedna z inzercí se dokonce zdá být dimorfická: v genofondu potápek malých je zatím přítomna jak alela s retropozonem, tak i alela bez něj. Jde o vůbec první případ, kdy byla v rámci ptáků zaznamenána retropoziční aktivita specifická pro jediný terminální taxon ("druh"), a o důkaz toho, že by CR1 retropozony mohly být užitečné pro budoucí studie z oblasti populační genetiky (viz výše).
Studie Suha a spol. je cenná také pro vhled, který vnáší do evoluce samostatných retropozonů. Zajímavá je např. skutečnost, že jedna z inzercí přítomných u všech mirandornitů je blízce příbuzná jednomu podtypu rodiny CR1, který byl zdokumentován u pěvčí linie moderních ptáků (viz obrázek výše). Zatímco v pěvčí linii aktivita této konkrétní skupiny retropozonů končí s neoavianní radiací – období velmi rychlého odštěpování vývojových větví, při kterém vznikly všechny moderní ptačí "řády" mimo hrabavých, vrubozobých a paleognátů a ke kterému zřejmě došlo těsně před koncem křídy –, v linii potápek trvala daleko déle a skončila až s oddělením linie potápek od linie plameňáků před téměř 50 miliony let (Brown & van Tuinen 2011). Suh a spol. uznávají, že se jejich studie zabývala jen malým zlomkem všech CR1 retropozonů obsažených v genomu potápky malé; jejím hlavním cílem však bylo ukázat postup, jakým lze extrahovat retropozony z jakéhokoli ptačího genomu bez nutnosti úplného osekvenování. Metoda podle všeho skutečně funguje: ač autoři tato data neukázali, úspěšně ji dokázali aplikovat i na papouška, sokola a pštrosa emu, aniž by se setkali s nějakým závažným problémem. Postup dále dokáže identifikovat nejen dlouho mrtvé inzerce, jako jsou ty, které sjednocují Mirandornithes (aktivní v raném paleogénu) a Eufalconimorphae (ve svrchní křídě), ale i retropozony aktivní stále nebo aspoň velmi nedávno, jak naznačuje nalezení bialelické inzerce u potápky malé. Cílená extrakce retropozonů pomocí CR1 slibuje odkrýt spoustu markerů potenciálně užitečných pro studium fylogeneze, genomové evoluce a populační genetiky u ptáků a do budoucna snad i jiných skupin.
4. Acknowledgments
Děkuji Alexanderu Suhovi za to, že mě upozornil na svou novou publikaci, a za ochotu, s níž zodpověděl mé otázky ohledně vlivu homoplazie na retropozonové fylogenetické analýzy – některá z jeho vysvětlení jsem využil i v tomto článku.
Zdroje:
Retropozony mohou být užitečné nejen při studiu fylogenetických vztahů mezi vzdálenými taxony, ale i ke sledování populačních změn a diferenciace. Obrázek zachycuje čtyři dceřiné populace vzešlé z jediné populace mateřské, z nichž každá vykazuje vlastní jedinečnou frekvencí výskytu retropozonů na dvou lokusech. Populace zcela vlevo navíc získala zcela novou retropozonovou inzerci na třetím lokusu, která je pro ni unikátní. Takové polymorfické lokusy umožňují identifikovat hybridy nebo stanovit míru genetického toku mezi populacemi. (Zdroj: Ray 2007: Figure 3)
2. Retropozony ve fylogenetice
K fylogenetické analýze retropozonů stačí většinou obyčejná parsimonie. Evoluce retropozonů je totiž oproti evoluci nukleotidů docela nudná, takže nepotřebujeme všechny ty složité modely s gama-distribuovanou variací v tempu evoluce, proporcemi invariantních pozic atd. Přesto se už objevily návrhy, jak ji modelovat a vyrovnat se s některými z jejich zvláštností: retropozony by se např. mohly do některých lokusů integrovat častěji než do jiných (Han et al. 2011), náhodné mutace by je mohly u různých taxonů zahlazovat různými rychlostmi (Waddell et al. 2001), a inzerce pocházející z multiplikace stejného retropozonu nemají nezávislý výskyt (Miyamoto 1999). Přesto parsimonie i přes své četné chyby (viz zde, zde) stačí, neboť retropozony nejsou jen tak obyčejné znaky. Steel & Penny (2000) ukázali, že mohou-li znaky nabývat dostatečně mnoha stavů, bude parsimonie statisticky konzistentní (= s více daty se bude blížit správnému stromu) pro všechny možné kombinace parametrů – vyhne se tedy i nechvalně proslulému přitahování dlouhých větví ve Felsensteinově zóně. Otázkou je, kolik je "dostatečně mnoho": 4 stavy, které používá většina sekvenčních analýz, rozhodně nestačí, jelikož přitahování dlouhých větví v nich pozorujeme docela běžné. Ale při integraci do ptačího genomu mohou retropozony vklouznout do téměř kterékoli z 1,2 miliard možných pozic, z nichž každá představuje samostatný znakový stav (Matzke et al. 2012). Výjimečnosti retropozonů si v tomto ohledu povšimli jak Steel & Penny (2000), tak Sober (2004) – druhá práce dokonce předem varuje, že při diskuzi o kladech a záporech parsimonie a věrohodnosti bude retropozonové inzerce ignorovat, jelikož obvyklé poučky zde ztrácejí význam. Díky tomu je oprávněné říct, že parsimonie nad retropozonovými daty má stejné vlastnosti jako spolehlivější věrohodnost (Suh et al. 2011a; Matzke et al. 2012).
Rozbory retropozonových inzercí představují alternativní přístup, jak z DNA dostat fylogeneticky cenné informace. Běžné analýzy, které kódují každý jednotlivý nukleotid samostatně, mají mnohé výhody – téměř neomezený počet znaků s jasně definovanými stavy –, ale také mnoho problémů. Fylogenetický signál může zcela smazat saturace (jev, který nastává, pokud nukleotidová pozice prodělala vícero mutací, než dospěla k nyní pozorovanému stavu), zvláště u rychle se vyvíjejících třetích pozic kodonů; homoplazie v kombinaci s odlišnými rychlostmi evoluce vede k přitahování dlouhých větví, které může svést na scestí každou fylogenetickou metodu (byť některé jsou schopny tuto chybu s více daty napravit); a rizikem je i base composition bias, tedy shlukování taxonů s podobným poměrným zastoupením jednotlivých bází v genomu bez ohledu na reálné příbuzenství.
Ani jedním z těchto problémů retropozony netrpí. Možnost klasické homoplazie je zde totiž velice omezená: znamenala by buď přesné vyříznutí, nebo nezávislou inzerci stejného typu se stejným zkrácením* a stejnou orientací na totéž místo v genomu. Může se to stát? Ano, může: ukázalo se, že genom má k dispozici mechanizmus pro přesné vystřižení (van de Lagemaat et al. 2005) a že i k paralelní inzerci občas dojde (u ptáků se to zřejmě stalo u sluk a datlů – Han et al. 2011), a nakonec snad přece jen existují tzv. "hot spots", místa, kam se retropozony integrují častěji než jinam (Han et al. 2011). Všechny studie, které se těmito problémy zabývaly, ale došly k závěru, že tyto jevy jsou stále velmi vzácné a nedochází k nim dost často na to, aby představovaly závažný problém (van de Lagemaat et al. 2005; Ray et al. 2006; Ray 2007) – dokonce i Han et al. (2011), kteří toho kolem celé otázky nadělali nejvíc, nakonec uznali, že "TE insertions retain a strong phylogenetic signal and [...] exhibit very little homoplasy" (p. 283), a to navíc jejich metody Matzke et al. (2012) označili za zavádějící a vůči retropozonům neférově tvrdé. Problémy typu přitahování dlouhých větví tedy zcela odpadají. Nemáme navíc důvod předpokládat, že nezávislé inzerce nebo přesné delece dvakrát způsobí přesně ten samý nepravdivý vzorec výskytu. Zdálo by se tedy, že cokoli víc než jedna inzerce se rovná železné jistotě. Waddell et al. (2001) problém uchopili jinak, z hlediska striktně statistického, a zformulovali kritérium ještě tvrdší: k zamítnutí nulové hypotézy jsou třeba aspoň 3 inzerce bez jakéhokoli konfliktního signálu.
Jediným z velkých problémů sekvenčních dat, kterého se nezbavíme ani u retropozonů, je hemiplazie. Ačkoli stejně jako běžná homoplazie vytváří konfliktní vzorce výskytu znaků, její mechanizmus je odlišný. Je důsledkem jevu známého jako nekompletní třídění linií, který nastává, pokud se ancestrální populace začala štěpit ještě předtím, než se v ní ustálil původní polymorfizmus. Evoluční linie vzešlé z tohoto štěpení zdědí všechny alely obsažené v genofondu původní populace, které se poté zafixují zcela náhodně. O nekompletním třídění linií mluvíme tehdy, když strom sestavený z alel na polymorfickém lokusu (gene tree) nesouhlasí s průběhem fylogeneze (species tree). Často se objevuje při velkých evolučních radiacích, k jaké došlo např. u báze placentálních savců. Právě zde se retropozonové stromy sekly, když Nishihara et al. (2006) odhalili silnou podporu pro klad zahrnující letouny, lichokopytníky, šelmy a luskouny, geniálně pojmenovaný jako Pegasoferae**. Ač podpořen 4 inzercemi, největší sekvenční studie jeho existenci zamítají (Zhou et al. 2011; Meredith et al. 2011). Zároveň jde však o pěknou ukázku toho, že pokud se nám pod rukama plete nekompletní třídění linií, většinou to poznáme: není to totiž tak, že by se všechny genové stromy spikly a společně odporovaly "species tree"; odporují i sobě navzájem. Už Nishihara a spol. si všimli jedné inzerce, jejíž výskyt se s Pegasoferae neslučuje, zato však odpovídá výsledkům sekvenčních analýz. Navíc i samotný výskyt hemiplazie může říct leccos zajímavého o evoluční historii skupiny (Matzke et al. 2012).
*Zkrácení (truncation) poukazuje na skutečnost, že většina inzercí zahrnuje pouze část originální RNA šablony. Důvodem je neúplná reverzní transkripce, která často "vynechává" hlavně u 5' konce původní sekvence (Volff et al. 2001; Han et al. 2011).
**Smím-li citovat z komentáře Mike'a Keeseyho na DML:
What do you call a clade that includes bats, horses, and Ferae (i.e., Carnivora plus whatever it's closest to, in this case pangolins)? Combine the bats and horses into winged horses, and then combine again! I think that's pretty clever.
Retropozonová homoplazie u ptáků podle Hana a spol. (2011). Vpravo jsou zobrazeny fylogenetické stromky vytvořené analýzou nejvyšší věrohodnosti (s bootstrapovými podporami nad 50%), vlevo zarovnané sekvence 4. intronu HMGN2 (a) a 2. intronu GH1 (b). V prvním případě byla zřejmě inzerce retropozonu z rodiny CR1 druhotně ztracena u lenivek (Bucco) a leskovců (Galbula), v tom druhém u "roadrunnera" Geococcyx. U kukalek (Coua) pak došlo k deleci velké části příslušného intronu; retropozon tím byl sice ztracen, nejedná se však o přesné vyříznutí, které jako jediné představuje při rekonstrukci fylogeneze problém. Chyba v topologii je prakticky vyloučena; na monofylii šplhavců (a) a kukaček (b) se shodují data z mtDNA, jaderného genomu, morfologie a dokonce i jiných retropozonů. Konfliktní vzorce výskytu je stále možno vysvětlit hemiplazií, ta se však většinou odehrává na krátkých větvích, zatímco větve vedoucí ke šplhavcům i kukačkám jsou docela dlouhé. (Zdroj: Han et al. 2011: Figure 3)
Vzhledem k těmto vlastnostem jsou retropozony ideálním nástrojem k nezávislému ověření výsledků sekvenčních analýz. Důležité je zde slovo "nezávislému": není třeba se bát, že sekvenční a retropozonové rozbory využívají dvakrát ta samá data. Ačkoli sekvenční analýza např. jaderných intronů na nějaký ten retropozon pravděpodobně narazí, pořád s ním bude zacházet jen jako s posloupností nezávisle se vyvíjejících nukleotidů. To není špatně: jakmile se retropozon jednou začlení do DNA, skutečně prodělává ty samé náhodné mutace jako každá jiná nekódující DNA; samotná inzerce však představuje proces zcela odlišný. Retropozonová analýza se stará právě jen o tento druhý proces: dokud lze rozpoznat, o jaký typ elementu jde, nejsou bodové mutace v jeho sekvenci důležité. Retropozon zde není kódován jako několik stovek znaků o 4 stavech s nejasnou polaritou, ale jako znak jediný, který se navíc polarizuje zcela sám, bez potřeby nějaké outgroup, takže odvozený stav (přítomnost inzerce) lze od primitivního stavu (absence inzerce) odlišit automaticky.
Vzhledem k tomu, jak problematické jsou vzájemné příbuzenské vztahy žijících ptáků, není divu, že své naděje do retropozonů začínají vkládat i ornitologové (Livezey 2011; Mayr 2011). První analýzy tohoto typu zde však nastoupily až s určitým zpožděním oproti savcům, a přestože průkopnické studie jsou staré už přes pět let (Watanabe et al. 2006; Kriegs et al. 2007), více se v tomto směru začalo podnikat až zcela nedávno (Suh et al. 2011a; Matzke et al. 2012; Liu et al. 2012). Jednoznačně nejvýznamnější ze všech dosud provedených retropozonových analýz ptáků pak loni publikovali Suh et al. (2011b), jejichž strom přinesl podporu pro nečekaně mnoho skupin již dříve vzešlých z analýz velkého množství sekvenčních dat. Šlo např. o klady Psittacopasserae (složený z papoušků a pěvců) a Eufalconimorphae (papoušci, pěvci, sokoli).
Zároveň šlo však o ukázku problému, který nedávno zmínil John Harshman v komentáři na Tetrapod Zoology. Retropozonové studie musí být zaměřeny na nějakou konkrétní skupinu či aspoň posloupnost uzlů na kladogramu. Chceme-li znát fylogenetickou pozici pěvců, je nutné zkoumat inzerce sdílené s pěvci. A zatímco analýza takových inzercí dokáže určit relativní fylogenetickou vzdálenost různých skupin od pěvců (papoušci k nim mají nejblíž, sokolovití dál, seriemy ještě dál atd.), vzájemné příbuzenské vztahy čehokoli, co leží mimo tuto páteřní linii – třeba ptáků, kteří tvoří společně samostatný klad a pěvcům jsou tedy vzdálení všichni úplně stejně –, ověřit nemůže. Proto ty rozsáhlé polytomie ve výsledném kladogramu, ve kterých se zcela rozpustila i některá dobře známá a nijak kontroverzní seskupení, jako např. Picocoraciae (šplhavci + "srostloprstí") nebo Strisores (svišťouni + "lelkové"). Není divu: k tomu by byla třeba celá nová sada informativních inzercí, a k tomu je dobré mít osekvenovaný kompletní genom. Ten je zatím k dispozici jen pro kuře (Gallus gallus) a zebřičku pestrou (Taeniopygia guttata) – jenže co když chceme znát příbuzenské vztahy nějakých jiných ptáků?
3. Suh et al. 2012
Právě na tuto otázku se snaží odpovědět nová studie Alexandera Suha a kolektivu, která byla měsíc zpátky přijata pro publikaci v žurnálu Molecular Biology and Evolution. Autoři připomínají, že ačkoli některé studie zkoumaly retropozony i u ptáků, pro něž ještě není kompletní genom k dispozici (např. Watanabe et al. [2006] u tučňáků), vždy se jednalo jen o několik inzercí, které by rozhodně nestačily k provedení tak rozsáhlé studie, jakou publikovali Suh et al. (2011b). K tomu je potřeba buď získat nové úplné genomy, nebo vynalézt metodu, která dovede retropozony z genomu cíleně vytáhnout. Autoři takovou metodu představili a ihned ji také vyzkoušeli k otestování sesterského vztahu potápek a plameňáků, jedné z nejpozoruhodnějších fylogenetických hypotéz, které se v poslední době u ptáků vyskytly.
Potápka malá, hlavní hvězda nové studie. (Zdroj: birdforum.net, kredit: Nigel Pye)
3.1 Extrakce retropozonů a fylogenetická analýza
Suh et al. (2012) upravili protokol, který Wang & Kirkness (2005) vytvořili pro populačně-genetickou studii psů založenou na krátkých vmezeřených elementech (SINEs). Jaderná DNA se naštěpí pomocí restrikčního enzymu a podrobí se inverzní polymerázové řetězové reakci (PCR), která jako primery – tedy počáteční místa pro syntézu DNA – používá sekvence typické pro retropozony z rodiny CR1. Elementy z této skupiny tvoří velkou část retropozonů přítomných v ptačím genomu: spolu s dlouhými koncovými repeticemi (LTRs) přes 97% (Suh et al. 2011b). Inverzní PCR umožňuje amplifikaci (tj. zmnožení) i takových úseků DNA, jejichž přesnou sekvenci neznáme, za podmínky, že jsou z obou stran ohraničeny známými sekvencemi (které jsou doplňkové k primerům). Naštěpené fragmenty se při ní nejprve pomocí speciálního enzymu převedou do kruhové formy, která v sobě obsahuje jak známou sekvenci, tak i neznámý úsek, o jehož amplifikaci usilujeme. Následně je aplikován další restrikční enzym, který kruhovou molekulu rozstřihne a znovu ji tak převede do lineární podoby – a protože stříhá uvnitř známé sekvence, nová lineární forma bude obsahovat neznámý fragment ohraničený z obou stran známými sekvencemi, tedy přesně to, čeho jsme se snažili dosáhnout. Na tuto novou lineární molekulu už je pak možné aplikovat běžnou polymerázovou řetězovou reakci. Tímto postupem Suh et al. (2012) vytvořili genomovou knihovnu: soubor mnoha klonovatelných fragmentů DNA (v tomto případě obsahujících CR1 retropozony). Po naklonování a osekvenování už nic nic nebrání tomu, aby se nalezené inzerce využily ve fylogenetické analýze.
Ukázková studie byla provedena na potápce malé (Tachybaptus ruficollis). Z genomové knihovny sestavené podle výše uvedené procedury Suh et al. (2012) náhodně vybrali 180 klonů fragmentů obsahujících CR1 retropozony a pomocí programu pro zarovnávání (alignment) DNA sekvencí hledali shodu v genomech kuřete a zebřičky. Pokud najde dostatečně vysoký stupeň shody, rozšíří se hledání v obou směrech o další 2 kilobáze. Následuje osekvenování a zarovnání. Pak už nic nebrání tomu, aby byla aplikována přísná kritéria pro identifikaci kandidátních lokusů, která do detailu popsali už Suh et al. (2011b): vhodné jsou jen retropozony z vysoce konzervovaných intronů nebo mezigenových oblastí kratších než 1,5 kilobáze. Těmito požadavky prošlo jen 38 lokusů z původních 180, z nichž dva navíc obsahovaly pouze inzerci sdílenou mezi potápkou a zebřičkou. Jelikož linie vedoucí k zebřičce se už detailní analýzy dočkala (Suh et al. 2011b), autoři tyto dva lokusy vyřadili z další analýzy. Zarovnané sekvence potápky, kuřete a zebřičky se prohledají na zakonzervované oblasti, tedy místa, kde všechny tři genomy vykazují stejnou nebo aspoň velmi podobnou sekvenci. K této sekvenci se vytvoří komplementární primer pro polymerázovou řetězovou reakci. Potřeba je však ještě druhý primer, který ale nemůže být vytvořen na základě stejného postupu: klon fragmentu z genomu potápky obsahuje jen jednu z obou "flanking sequences". Druhý primer je tedy vytvořen čistě na základě předpokladu, že co je stejné u kuřete a zebřičky, bude stejné i u potápek. To je předpoklad docela rozumný (potápky patří do Neognathae, což znamená, že jsou potomky posledního společného předka kuřete a zebřičky), ale občas se samozřejmě sekne: v takových případech navrhují Suh a spol. vytvořit několik alternativních primerů, aby se zvýšila šance dosáhnout s PCR úspěšných výsledků. V tomto konkrétním případě se povedlo najít 15 markerů, které bylo možné osekvenovat napříč taxonomickým vzorkem.
Z nich Suh et al. (2012) sestavili datovou matrici, v níž je přítomnost retropozonu kódována jako "+" a absence jako "–". Jako OTUs byly použity tři taxony potápek a dvě jejich potenciální sesterské zástupci skupiny. Tou první jsou plameňáci, které v sesterské pozici vůči potápkám odhalují téměř všechna známá data krom některých morfologických znaků (viz níže). Ty jako sesterskou skupinu potápek identifikují morfologicky i ekologicky, pravda, daleko podobnější potáplice (Livezey & Zusi 2007). Daleko zajímavějším fylogenetickým problémem je nicméně hledání sesterské skupiny k celému kladu Mirandornithes, jak skupinu sestávající z potápek a plameňáků pojmenoval Sangster (2005). Brown et al. (2008) a Morgan-Richards et al. (2008) na této pozici odkryli dlouhokřídlé. Obě studie byly založeny na datech z mitochondriální DNA a měly podstatné nedostatky: ta první použila velice rozsáhlý taxonomický vzorek (135 taxonů), ale nekompletní mtDNA sekvence; zatímco ta druhá analyzovala kompletní mt-genomy, avšak u daleko menšího počtu taxonů. Pacheco et al. (2011), kteří zkombinovali to nejlepší z obou studií, přinesli spíše rozporuplné výsledky: v první z dílčích analýz byli sesterským taxonem Mirandornithes opět dlouhokřídlí, ovšem v kombinaci s holuby; v té druhé pak skupina složená z "brodivých", "veslonohých", tučňáků, trubkonosých, potáplic a zcela bizarně i potuů (Nyctibiidae). (Mayr [2011] takové uskupení nazval Aequornithes, potuovité ale v souladu s daty z morfologie i jaderné DNA řadil úplně jinam.) S holuby – resp. s kladem sestávajícím z holubů, mesitů, stepokurů a faetonů – dala mirandornity dohromady také dosud největší studie jaderné DNA (Hackett et al. 2008). Aby otestovali co nejvíce z těchto hypotéz, zařadili Suh et al. (2012) do svého rozboru potáplici, racka a holuba. Škoda je snad jen vynechání mesitů, které coby sesterskou skupinu Mirandornithes ve své vynikající revizi ptačí fylogenetiky navrhl Mayr (2011).
Fylogenetický strom, založený na analýze 15 retropozonových inzercí metodou nejvyšší úspornosti. Tmavošedé kuličky symbolizují fylogeneticky informativní markery odkryté pomocí nové metody; světle šedá kulička nad větví B označuje inzerci objevenou v sekvencích z GenBanku a černá kolečka reprezentují inzerce jedinečné pro daný terminální taxon. Způli vyplněné kolečko označuje dimorfickou (bialelickou) inzerci – v populaci potápky malé se vyskytuje jak alela, která ji nese, tak i alela, která ji postrádá. Hvězdička vyznačuje taxony, pro které přinesla podporu předchozí retropozonová studie zaměřená na větev vedoucí k zebřičce pestré (Suh et al. 2011b). Kladogram vyvrací hypotézu o blízkém příbuzenském vztahu potápek a potáplic, založenou především na pánevní morfologii, a podporuje naopak hypotézu Mirandornithes, podle níž mají ze všech žijících ptáků k potápkám nejblíže plameňáci. Zobrazené taxony jsou (odshora dolů): potápka malá, potápka australská, potápky roháč a žlutorohá, plameňáci, potáplice, racci, holubi, zebřička pestrá a kuře. (Zdroj: Suh et al. 2012: Figure 3)
Fylogram zkonstruovaný metodou nejvyšší věrohodnosti, zobrazující příbuzenské vztahy mezi CR1 elementy přítomnými u potápky malé (tučná písmena na šedém pozadí) a podrodinami stejné skupiny retropozonů známými od kuřete (šedě) a zebřičky malé (černě). Fylogeneze je založena na 0,7 kilobázích z 3’ konce příslušných inzercí a zakořeněna byla podle želví podrodiny CR1 (PSLINE). Zobrazeny jsou bootstrapové podpory nad 50%, 100% hodnoty jsou vyznačené hvězdičkou. (Zdroj: Suh et al. 2012: Figure S2)
Autoři dělí 15 prozkoumaných inzercí do 4 podrodin podle toho, v jakém období byly aktivní, což koresponduje s tím, na jakém uzlu je odkrývá fylogenetická analýza. Dvě z nich se nacházejí u potápek a plameňáků, avšak u žádného jiného ze zkoumaných ptáků – další důkaz toho, že hypotéza o blízkém příbuzenství potápek a potáplic je chybná a založená pouze na konvergentních podobnostech, vyplývajících ze shodného způsobu plavání pomocí zadních končetin. Podpořena je tím naopak existence kladu Mirandornithes a Mayrovo tvrzení, že sesterský vztah mezi plameňáky a potápkami představuje jeden z nejlépe podložených "kladů vyšší úrovně" v rámci moderních ptáků (Mayr 2004). Jak na DML podotkl David Marjanović, zdá se, že jeden z nejlépe podložených kladů může být klidně přehlížen skoro 250 let: systematiky nikdy nenapadl, dokud jej neodkryli van Tuinen et al. (2001) s kombinovanou analýzou jaderné a mitochondriální DNA. Podpora pro toto seskupení začala rychle vzrůstat, a to jak díky molekulám (Brown et al. 2008; Hackett et al. 2008; Morgan-Richards et al. 2008; Pacheco et al. 2011), tak i dlouho nedoceněným morfologickým datům (Mayr 2004; Manegold 2006), paleontologii (Mayr 2007) nebo parazitologii (Johnson et al. 2006). Nyní se přidávají i retropozony.
Ze zbylých 13 retropozonů se 3 vyskytují u všech zahrnutých potápek, čímž (statisticky významně) podporují monofylii kladu Podicipediformes. 5 dalších inzercí potvrzuje monofylii kladu Tachybaptus, který zahrnuje jak potápku malou, tak i potápku australskou, v souladu s uznávanou taxonomií potápek (Fjeldså 2004). A konečně posledních pět markerů je autapomorfických pro potápku malou či dokonce nějakou její konkrétní populaci. Jedna z inzercí se dokonce zdá být dimorfická: v genofondu potápek malých je zatím přítomna jak alela s retropozonem, tak i alela bez něj. Jde o vůbec první případ, kdy byla v rámci ptáků zaznamenána retropoziční aktivita specifická pro jediný terminální taxon ("druh"), a o důkaz toho, že by CR1 retropozony mohly být užitečné pro budoucí studie z oblasti populační genetiky (viz výše).
Studie Suha a spol. je cenná také pro vhled, který vnáší do evoluce samostatných retropozonů. Zajímavá je např. skutečnost, že jedna z inzercí přítomných u všech mirandornitů je blízce příbuzná jednomu podtypu rodiny CR1, který byl zdokumentován u pěvčí linie moderních ptáků (viz obrázek výše). Zatímco v pěvčí linii aktivita této konkrétní skupiny retropozonů končí s neoavianní radiací – období velmi rychlého odštěpování vývojových větví, při kterém vznikly všechny moderní ptačí "řády" mimo hrabavých, vrubozobých a paleognátů a ke kterému zřejmě došlo těsně před koncem křídy –, v linii potápek trvala daleko déle a skončila až s oddělením linie potápek od linie plameňáků před téměř 50 miliony let (Brown & van Tuinen 2011). Suh a spol. uznávají, že se jejich studie zabývala jen malým zlomkem všech CR1 retropozonů obsažených v genomu potápky malé; jejím hlavním cílem však bylo ukázat postup, jakým lze extrahovat retropozony z jakéhokoli ptačího genomu bez nutnosti úplného osekvenování. Metoda podle všeho skutečně funguje: ač autoři tato data neukázali, úspěšně ji dokázali aplikovat i na papouška, sokola a pštrosa emu, aniž by se setkali s nějakým závažným problémem. Postup dále dokáže identifikovat nejen dlouho mrtvé inzerce, jako jsou ty, které sjednocují Mirandornithes (aktivní v raném paleogénu) a Eufalconimorphae (ve svrchní křídě), ale i retropozony aktivní stále nebo aspoň velmi nedávno, jak naznačuje nalezení bialelické inzerce u potápky malé. Cílená extrakce retropozonů pomocí CR1 slibuje odkrýt spoustu markerů potenciálně užitečných pro studium fylogeneze, genomové evoluce a populační genetiky u ptáků a do budoucna snad i jiných skupin.
4. Acknowledgments
Děkuji Alexanderu Suhovi za to, že mě upozornil na svou novou publikaci, a za ochotu, s níž zodpověděl mé otázky ohledně vlivu homoplazie na retropozonové fylogenetické analýzy – některá z jeho vysvětlení jsem využil i v tomto článku.
Zdroje:
- http://dml.cmnh.org/2011Aug/msg00389.html
- http://blogs.scientificamerican.com/tetrapod-zoology/.../raptor-vs-raptor/#comment-2589
- http://www.natur.cuni.cz/.../bakalarske-prace-jaro-2011/dvorakova/bc-dvorakova.pdf
- http://en.wikipedia.org/wiki/Genomic_library
- http://dml.cmnh.org/2004Feb/msg00055.html
- Brown JW, Rest JS, García-Moreno J, Sorenson MD, Mindell DP 2008 Strong mitochondrial DNA support for a Cretaceous origin of modern avian lineages. BMC Biol 6: 6
- Brown JW, van Tuinen M 2011 Evolving perceptions on the antiquity of the modern avian tree. 306–24 in Dyke GJ, Kaiser G, eds. Living Dinosaurs: The Evolutionary History of Modern Birds. London: John Wiley and Sons
- Fjeldså J 2004 The grebes. New York: Oxford Univ Press.
- Hackett SJ, Kimball RT, Reddy S, Bowie RC, Braun EL, Braun MJ, Chojnowski JL, Cox WA, Han K, Harshman J, Huddleston CJ, Marks BD, Miglia KJ, Moore WS, Sheldon FH, Steadman DW, Witt CC, Yuri T 2008 A phylogenomic study of birds reveals their evolutionary history. Science 320(5884): 1763–8
- Han K-L, Braun EL, Kimball RT, Reddy S, Bowie RCK, Braun MJ, Chojnowski JL, Hackett SJ, Harshman J, Huddleston CJ, Marks BD, Miglia KJ, Moore WS, Sheldon FH, Steadman DW, Witt CC, Yuri T 2011 Are transposable element insertions homoplasy free? An examination using the avian tree of life. Syst Biol 60(3): 375–86
- Johnson KP, Kennedy M, McCracken KG 2006 Reinterpreting the origins of flamingo lice: cospeciation or host-switching? Biol Lett 2(2): 275–8
- Kriegs JO, Matzke A, Churakov G, Kuritzin A, Mayr G, Brosius J, Schmitz J 2007 Waves of genomic hitchhikers shed light on the evolution of gamebirds (Aves: Galliformes). BMC Evol Biol 7: 190
- Liu Z-F, He L-W, Yuan H-G, Yue B-S, Li J 2012 CR1 retroposons provide a new insight into the phylogeny of Phasianidae species (Aves: Galliformes). Gene 502(2): 125–32
- Livezey BC 2011 Progress and obstacles in the phylogenetics of modern birds. 117–45 in Dyke GJ, Kaiser G, eds. Living Dinosaurs: The Evolutionary History of Modern Birds. London: John Wiley and Sons
- Livezey BC, Zusi RL 2007 Higher-order phylogeny of modern birds (Theropoda, Aves: Neornithes) based on comparative anatomy: II. – Analysis and discussion. Zool J Linn Soc 149(1): 1–95
- Manegold A 2006 Two additional synapomorphies of grebes Podicipedidae and flamingos Phoenicopteridae. Acta Ornithol 41(1): 79–82
- Matzke A, Churnakov G, Berkes P, Arms EM, Kelsey D, Brosius J, Kriegs JO, Schmitz J 2012 Retroposon insertion patterns of neoavian birds: strong evidence for an extensive incomplete lineage sorting era. Mol Biol Evol 29(6): 1497–501
- Mayr G 2004 Morphological evidence for sister group relationship between flamingos (Aves: Phoenicopteridae) and grebes (Podicipedidae). Zool J Linn Soc 140(2): 157–69
- Mayr G 2007 The contribution of fossils to the reconstruction of the higher level phylogeny of birds. Spec Phyl Evol 1: 59–64
- Mayr G 2011 Metaves, Mirandornithes, Strisores, and other novelties – a critical review of the higher-level phylogeny of neornithine birds. J Zool Syst Evol Res 49(1): 58–76
- Meredith RW, Janečka JE, Gatesy J, Ryder OA, Fisher CA, Teeling EC, Goodbla A, Eizirik E, Simão TL, Stadler T, Rabosky DL, Honeycutt RL, Flynn JJ, Ingram CM, Steiner C, Williams TL, Robinson TJ, Burk-Herrick A, Westerman M, Ayoub NA, Springer MS, Murphy WJ 2011 Impacts of the Cretaceous Terrestrial Revolution and KPg extinction on mammal diversification. Science 334(6055): 521–4
- Miyamoto MM 1999 Molecular systematics: Perfect SINEs of evolutionary history? Curr Biol 9(21): R816–9
- Morgan-Richards M, Trewick SA, Bartosch-Härlid A, Kardailsky O, Phillips MJ, McLenachan PA, Penny D 2008 Bird evolution: testing the Metaves clade with six new mitochondrial genomes. BMC Evol Biol 8: 20
- Nishihara H, Hasegawa M, Okada N 2006 Pegasoferae, an unexpected mammalian clade revealed by tracking ancient retroposon insertions. Proc Natl Acad Sci USA 103(26): 9929–34
- Pacheco MA, Battistuzzi FU, Lentino M, Aguilar RF, Kumar S, Escalante AA 2011 Evolution of modern birds revealed by mitogenomics: timing the radiation and origin of major orders. Mol Biol Evol 28(6): 1927–42
- Ray DA 2007 SINEs of progress: Mobile element applications to molecular ecology. Mol Ecol 16: 19–33
- Ray DA, Xing J-C, Salem A-H, Batzer MA 2006 SINEs of a nearly perfect character. Syst Biol 55(6): 928–35
- Sangster G 2005 A name for the flamingo-grebe clade. Ibis 147(3): 612–5
- Sober E 2004 The contest between parsimony and likelihood. Syst Biol 53(4): 644–53
- Suh A, Kriegs JO, Brosius J, Schmitz J 2011a Retroposon insertions and the chronology of avian sex chromosome evolution. Mol Biol Evol. 28(11): 2993–7
- Suh A, Kriegs JO, Donnellan S, Brosius J, Schmitz J 2012 A universal method for the study of CR1 retroposons in nonmodel bird genomes. Mol Biol Evol doi:10.1093/molbev/mss124
- Suh A, Paus M, Kiefmann M, Churakov G, Franke FA, Brosius J, Kriegs JO, Schmitz J 2011b Mesozoic retroposons reveal parrots as the closest living relatives of passerine birds. Nature Comms 2: 443
- Steel M, Penny D 2000 Parsimony, likelihood, and the role of models in molecular phylogenetics. Mol Biol Evol 17(6): 839–50
- van de Lagemaat LN, Gagnier L, Medstrand P, Mager DL 2005 Genomic deletions and precise removal of transposable elements mediated by short identical DNA segments in primates. Genome Res 15(9): 1243–9
- van Tuinen M, Butvill DB, Kirsch JAW, Hedges SB 2001 Convergence and divergence in the evolution of aquatic birds. Proc R Soc Lond B 268(1474): 1345–50
- Volff J-N, Hornung U, Schartl M 2001 Fish retroposons related to the Penelope element of Drosophila virilis define a new group of retrotransposable elements. Mol Gen Genom 265(4): 711–20
- Waddell PJ, Kishino H, Ota R 2001 A phylogenetic foundation for comparative mammalian genomics. Genome Inform 12: 141–54
- Wang W, Kirkness EF 2005 Short interspersed elements (SINEs) are a major source of canine genomic diversity. Genome Res 15: 1798–808
- Watanabe M, Nikaido M, Tsuda TT, Inoko H, Mindell DP, Murata K, Okada N 2006 The rise and fall of the CR1 subfamily in the lineage leading to penguins. Gene 365: 57–66
- Zhang Y-J, Wu Y-R, Liu Y-L, Han B 2005 Computational identification of 69 retroposons in Arabidopsis. Plant Physiol 138: 935–48
- Zhou X-M, Xu S-X, Xu J-X, Chen B-Y, Zhou K-Y, Yang G 2011 Phylogenomic analysis resolves the interordinal relationships and rapid diversification of the laurasiatherian mammals. Syst Biol 61(1): 150–64