From my halftime seminar

A couple of weeks ago I presented my halftime seminar at IFM Biology, Linköping university. The halftime at our department isn’t a particularly dramatic event, but it means that after you’ve been going for two and a half years (since a typical Swedish PhD programme is four years plus 20% teaching to a total of five years), you get to talk about what you’ve been up to and discuss it with an invited opponent. I talked about combining genetic mapping and gene expression to search for quantitative trait genes for chicken domestication traits, and the work done so far particularly with relative comb mass. To give my esteemed readers an overview of what my project is about, here come a few of my slides about the mapping work — it is described in detail in Johnsson & al (2012). Yes, it does feel very good to write that — shout-outs to all the coauthors! This is part what I said on the seminar, part digression more suited for the blog format. Enjoy!

Slide04(Photo: Dominic Wright)

The common theme of my PhD project is genetic mapping and genetical genomics in an experimental intercross of wild and domestic chickens. The photo shows some of them as chicks. Since plumage colour is one of the things that segregate in this cross, their feathers actually make a very nice illustration of what is going on. We’re interested in traits that differ between wild and domestic chickens, so we use a cross based on a Red Jungefowl male and three domestic White Leghorn females. Their offspring have been mated with each other for several generations, giving rise to what is called an advanced intercross line. Genetic variants that cause differences between White Leghorn and Red Jungefowl chickens will segregate among the birds of the cross, and are mixed by recombination at meiosis. Some of the birds have the Red Junglefowl variant and some have the White Leghorn variant at a given part of their genome. By measuring traits that vary in the cross, and genotyping the birds for a map of genetic markers, we can find chromosomal chunks that are associated with particular traits, i.e. regions of the genome where we’re reasonably confident harbour a variant affecting the trait. These chromosomal chunks tend to be rather large, though, and contain several genes. My job is to use gene expression measurements from the cross to help zero in on the right genes.

The post continues below the fold! Fortsätt läsa

Fler gyckelblommor och deras cis- och transreglerade färger

Detta har hänt: Det finns röda och gula gyckelblommor som bor i olika delar av Californien. I ett område där de möts, en så kallad hybridzon, kan de korsa sig, men populationerna är ändå till största del separerade bland annat för att röda och gula blommor pollineras av olika djur som föredrar blommor av respektive färg. Det vore alltså extra kul att veta vilka genetiska varianter som skiljer röda och gula blommor, eftersom de också är varianter som påverkar reproduktiv isolering mellan olika populationer av gyckelblommor. Anthocyaniner är röda och lila färgämnen i växter; gener inblandade i anthocyaninhantering är såklart huvudmisstänkta. Därför gjorde Streisfeld & Rauscher (2009) en genuttrycksundersökning av de gener som kodar för de proteiner som tillverkar anthocyanin i de här blommorna. Mycket riktigt: regleringen av anthocyaninsyntes skiljer sig mellan blommorna, och genetisk kartläggning ledde Streisfeld & Rauscher till två regioner i genomet. I en av dem ligger genen Dfr, som kodar ett av enzymerna i kedjan. Det var en väldigt rimlig hypotes att någon variant i Dfr skulle vara inblandad, men så verkar inte vara fallet. Tillbaka till ritbordet: finns det någon annan gen, nära Dfr, som kan vara inblandad istället? Där står vi när den dagens artikel börjar.

Det är inte meningen att den här bloggen ska handla helt om gyckelblommor, men det är var också för bra att inte skriva om: genetisk kartläggning, genuttryck, naturligt förekommande varianter som påverkar egenskaper. Växter eller djur spelar mindre roll: den här artikeln är ett typiskt exempel på genetisk forskning jag är intresserad av. (Det är i alla fall inte precis samma art som förra gångerna: Mimulus aurantiacus istället för guttatus …) Även om jag är förtjust i diagram och grafer för egen del är jag ganska usel på att titta noga på dem. Därför tänkte jag presentera den här artikeln i form av några av dess figurer. Det är också en anledning att jag föredrar att skriva om open access-artiklar, där det är fritt fram att återanvända bilder. Alla figurerna kommer från Streisfeld, Young & Sobel (2013) och omfattas av Creative Commons Attribution-licensen.

Figur 1 — en karta över hybridzonen och ett par fotografier av blommorna. Gula blommor finns åt öster och de röda åt väster.

journal.pgen.1003385.g001

Det här är en karikatyr av hur det röda färgämnet anthocyanin tillverkas i en växt: en serie kemiska rekationer som katalyseras av olika enzymer och som regleras av ett gäng transkriptionsfaktorer (delvis oklart vilka de alla är). Flera av generna i den här kedjan uttrycks olika mycket i röda och gula blommor — de reglerande transkriptionfaktorerna är de geometriska formerna till höger, och det är bland dem som den eftersökta genen (antaligen) finns. Det här är vad som på fikonspråk heter trans-reglering. Trans betyder typ ”på andra sidan”, och det betyder i det här sammanhanget att en gen regleras från någonannanstans i genomet, av en annan gen. Motsatsen är cis-reglering: reglering på nära håll. En transreglerande genetisk variant är något som påverkar en gen så att den i sin tur påverkar de andra gener som den reglerar.

journal.pgen.1003385.g002

Så de gav sig ut på jakt efter den saknade transreglerande genen. Anthocyaninsyntes är rätt väl beskrivet i en del andra växter, så de började med att leta upp potentiella transkriptionsfaktorer. Det finns ingen referenssekvens för Mimulus aurantiacus, så de vände sig mot släktingen M. guttatus och fann tre lovande kandidater som de kunde hitta uttryckta i blommorna.

Nästa figur är ett släktträd men inte av arter utan av gener, baserat på hur lika proteinernas aminosyrasekvenser är varandra. Pilarna pekar ut de tre misstänkta transkriptionsfaktorerna MaMyb1, 2 och 3. Generna heter alltså Myb1, 2 och 3 och de två första bokstäverna står för Mimulus aurantiacus. De jämförs med andra gener från andra arter, bland annat några ”Mg” (Mimulus guttatus) och ”At” (Arabidopsis thaliana; backtrav). MaMyb1 och MaMyb2 hamnar på samma gren som andra gener som är kända för att reglera anthocyanin i M. guttatus.

journal.pgen.1003385.g003

Tre gener alltså… Dags för lite genetisk kartläggning. Den misstänkta genen måste ligga ganska nära Dfr, på fikonspråk: vara länkad till Dfr. Hur avgör en det? Jo, genom att typa genetiska markörer nära MaMyb1, MaMyb2, MaMyb3 och Dfr, och se hur ofta det förekommer rekombinationer emellan dem; rekombinationsfrekvens är ju ett mått på genetiskt avstånd. De tittade i en experimentkorsning mellan röda och gula blommor, och MaMyb1 och 3 var inte länkad till Dfr, men avståndet till MaMyb2 var ungefär 11 cM (vilket är typ 11% rekombinationsfrekvens). Okej, har genotyp på MaMyb2 någon effekt på anthocyanin? Panel A visar effekten av genotyp hos MaMyb2 (svart stapel) och Dfr (vit stapel) i samma korsning — och mycket riktigt, MaMyb2 är associerat med anthocyanin. Dfr är det inte!

Panel B visar samma typ av resultat, men i naturligt förekommande hybrider från hybridzonen ovan. Det finns ett tydligt mönster där en viss genotyp (färg i diagrammet) på markörer i MaMyb2-genen överensstämmer med gul respektive röd färg. Markörer nära Dfr har inget tydligt mönster.

journal.pgen.1003385.g004

Okej, så om en vill veta ifall en gen utför en viss funktion, i det här fallet gör blommor röda, vad är ett bra experiment? Slå ut genen och se om funktionen också går sönder! Virus-induced gene silencing är en metod som lite liknar genterapi. Växter tolererar naturligtvis ogärna virus, och metoden går ut på att sätta in en kopia av en växtgen i ett virus, så att växten överreagerar och stänger ner uttrycket av den egna genen av bara farten. Nästa bild, panel A, visar ett exempel på resultatet. När MaMyb2 tystas blir en blomma som normalt skulle bli röd (om inte helt så delvis) gul:

journal.pgen.1003385.g006

Panel B visar att den synliga effekten också är där på molekylär nivå. De svarta visar genuttryck i normala blommor och de vita genuttryck i de virusbehandlade: Inte bara MaMyb2 utan också andra gener i anthocyaninsystemet är nedreglerade — vilket pekar på att MaMyb2 reglerar dem.

Så, MaMyb2 är definitivt inblandad i färg. Om den stängs av har det en effekt både på genuttryck och färg. Panel C — och det är den sista bilden vi ska titta på idag — visar resultatet av ett experiment för att pröva om det är just detta som händer med en naturligt förekommande genetisk variant i de röda och gula blommorna.

Tricket är att med pyrosekvensering (en sekvenseringsteknik som är lite annorlunda den den jag brukar prata om, men den har sin speciella roll) går det faktiskt att mäta genuttryck på allelnivå — i heterozygota individer (blommor som har både allelen för röda och för gula blommor), vilken av allelerna är det som uttrycks mest? De grå staplarna visar andelen av den röda allelen — och den är nära 1. Den gula allelen uttrycks nästan inte alls.

Det här är ett utmärkt tillfälle att introducera en teknisk term att skrämma vänner och bekanta med: detta betyder att MaMyb2 har en så kallad cis-eQTL. QTL står för quantitative trait locus — en plats i genomet (ett locus) som påverkar en kvantitativ egenskap. e:et står för expression — alltså genuttryck. Cis betyder som sagt att varianten är nära. Panel C tyder på att det finns en genetisk variant i närheten som påverkar regleringen av MaMyb2 och i sin tur blommornas färg. Sammantaget ger den här artikeln utmärkt stöd för en (ännu okänd) variant nära MaMyb2 som en av de två generna som förklarar skillnaden i färg mellan gula och röda blommor. Och där slutar vi för idag.

Litteratur

Streisfeld MA, Rausher MD. (2009) Altered trans-Regulatory Control of Gene Expression in Multiple Anthocyanin Genes  Contributes to Adaptive Flower Color Evolution in Mimulus aurantiacus. Molecular biology and evolution 26 ss. 433-44 doi: 10.1093/molbev/msn268

Streisfeld MA, Young WN, Sobel JM (2013) Divergent Selection Drives Genetic Differentiation in an R2R3-MYB Transcription Factor That Contributes to Incipient Speciation in Mimulus aurantiacus. PLoS Genet 9 e1003385 doi:10.1371/journal.pgen.1003385

Gyckelblommorna i Copperopolis och deras vissnande hybrider

Det var inte planerat att jag skulle ha tema gyckelblommor och genetiska bieffekter här, men så kom det ut en alldeles ny artikel från John Willis och hans kollegor: Kevin M. Wright m fl. (2013) Indirect evolution of hybrid lethality due to linkage with selected locus in Mimulus guttatus och det är helt enkelt för bra för att inte blogga om. Om två populationer av någon varelse varit separerade tillräckligt länge och några individer träffar på varandra och parar sig, så kan avkomman ha oväntade egenskaper. Ibland verkar hybriderna ovanligt stora och livskraftiga, och ibland har de olika problem eller är infertila. Det beror på olika sorters interaktioner mellan genetiska varianter från de båda populationerna som vanligtvis inte träffar på varandra. Infertilitet mellan hybrider, vilket kallas hybridinkompatibilitet, är ett steg mot reproduktiv isolering som skiljer arter åt.

Det finns populationer av Mimulus guttatus som anpassat sig inte bara till livet vid kusten utan också till livet vid en koppargruva där jorden är full av koppar: som i Copperopolis, California. Genetiska undersökningar från 70-talet och framåt har kommit fram till att det finns ett dominant mendelianskt anlag (ja, det har blivit ganska många av dem också på sista tiden) för koppartolerans som utmärker den här populationen. Det är nästan helt fixerat — det vill säga nästan alla individer har det — i Copperopolis, men väldigt ovanligt i andra populationer i närheten.

journal.pbio.1001498.g001

(Foto: Kevin Wright, CC:BY, figur 1 i en kommentar i samma tidskrift)

Men förutom koppartolerans orsakar det också hybridinkompatibilitet i korsningar med en del andra populationer. Hybriderna vissnar och lever sällan till reproduktiv ålder. Det verkar som att vissnandet är en genetisk bieffekt av koppartoleransvarianten. Men resultaten i den här artikeln visar att effekten beror av två olika varianter som ligger mycket nära varandra i genomet. Så istället för pleiotropi, samma variant som gör två saker, är det två länkade varianter. Men eftersom de är nära varandra ärvs de oftast tillsammans.

Hur tar en reda på om det är frågan om en eller flera varianter? Jo, gör korsningar, kartlägger egenskaperna och tittar efter rekombinationer mellan dem, naturligtvis! Jag ska bespara er detaljerna (inte för att de är så svåra; kolla artikeln om du är intresserad!), men författarna började med att kartlägga koppartolerans. De utgick från en korsning mellan koppartoleranta blommor och blommor från en populations om inte tål koppar, och backkorsade koppartolerant avkomma med blommor från Stinson Beach, California (inte heller koppartolerant) i flera generationer. I varje generation fanns så klart blommor som tålde koppar och de som inte gjorde det, och de kan titta efter genetiska markörer som är homozygota bland de icke-toleranta och heterozygota bland de toleranta. Varianten är ju dominant, så de icke-toleranta plantorna måste sakna den, medan de toleranta bör ha en kopia. På så sätt fick de fram 42 möjliga markörer, och när de sedan korsade samman avkomman och tittade efter associationer mellan markörer och tolerans fanns det bara en kvar som var kopplad till koppartolerans.

Så, när de placerat toleransvarianten på sin genetiska karta (rätt nära markören som heter MgSTS242) vände de sig till inkompatibiliteten. Samma variant eller en annan? De valde ut några plantor ur sin experimentpopulation som hade en rekombination mellan markören och toleransvarianten och korsade dem med en inkompatibel genotyp. Om varianterna ärvs tillsammans borde de flesta koppartoleranta få vissnande avkomma och de som inte tål koppar borde få frisk avkomma. Men några av dem, två rekombinanta blommor av nio, avvek från mönstret: en var koppartolerant men fick livskraftig avkomma; en annan var intolerant men gav upphov till vissnande hybrider (panel C i Figur 3, nedan: titta på 25_E01 och 25_E11). Det går alltså att skilja de två egenskaperna med rekombination — de kan alltså inte vara samma anlag!

journal.pbio.1001497.g003

(Figur 3 från Wright et al. CC:BY.)

Varianten för koppartolerans verkar ha varit med om naturligt urval i Copperopolispopulationen (åh, vilket ord!) de senaste 150 åren och naturligt urval lämnar (i alla fall under ideala förhållanden) spår i genomet. Urvalet betyder ju att en viss variant sprids på bekostnad av de andra allelerna, så den genetiska variationen minskar. Och på grund av länkning kommer varianter som ligger fysiskt nära varandra att tendera att ärvas tillsammans; det kallas hitch-hiking: metaforen är att de liftar med den urvalda varianten. Alltså minskar variationen i ett område kring den utvalda varianten. Författarna mätte hur mycket markörer nära tolerans- och inkompatibilitetsvarianterna varierade i Copperopolis och i två närliggande populationer som utan koppartolerans och jämförde det med andra markörer långt från toleransvarianten. Och mycket riktigt, regionen bär märken av starkt naturligt urval; och de uppskattar att inkompatibilitetsvarianten ligger tillräckligt nära toleransvarianten för att det är realistiskt att den bara har hängt med på naturligt urval för koppartolerans.

Så: frågan om länkning eller pleiotropi har i det här fallet ett definitivt svar: nej, är inte samma genetiska variant som orsakar koppartolerans som får hybriderna att vissna. Att ta reda på vilka gener och vilka varianter det är som ligger bakom är däremot inte helt enkelt. Gyckelblomman har tyvärr ingen riktigt bra referenssekvens, utan en stor samling fragment (jämför Darwinfinkarna). Författarna försökte bäst de kunde att kartlägga de bitar som finns men gick i stort sett bet. Det är också svårt att veta precis vad det är i området som gynnats av naturligt urval, men det verkar i alla fall tydligt att naturligt urval har ägt rum, och sannolikt har det gällt koppartolerans, som verkar helt avgörande för att kunna leva i Copperopolis. Hybridinkompatibiliteten, däremot, verkar inte ha någon direkt nytta, och den är antagligen bara en genetisk liftare.

Litteratur

Wright KM, Lloyd D, Lowry DB, Macnair MR, Willis JH (2013) Indirect Evolution of Hybrid Lethality Due to Linkage with Selected Locus in Mimulus guttatus. PLoS Biol 11(2): e1001497. doi:10.1371/journal.pbio.1001497

ENCODE, 80% och varför det mesta av skräpet fortfarande är skräp

ENCODE, encyclopedia of DNA elements, är på tapeten igen: det är några som skrivit en rätt elak kritisk artikel. Den är i och för sig open access så att alla kan läsa den, men jag rekommenderar den här i stället: Sean R Eddy, The C-value paradox, junk DNA, and ENCODE. Den är skriven i faq-/katekesform och är mer pedagogisk än Graur & co.

Vad är det då folk är så arga på? Tja, den här lilla filmen sammanfattar hypen kring ENCODE-projektet ganska väl: en gigantisk robot som slår cancer på käften. Och hela genomet är fullt av aktivitet ”even the parts we used to think of as junk”. Suck.

(Själv samlar jag mod för att redigera eller åtminstone diskutera svenska Wikipedias sida som är lika missvisande.)

Å andra sidan: den här artikeln ger en ganska fin sammanfattning av vad projektet egentligen gjorde. Alltså, precis som namnet antyder, är det fråga om en encyklopedi över dna-element i det mänskliga genomet. För ett par andra förträffliga varelser se modENCODE. Det ENCODE (och många andra) mätte var olika typer av aktivitet: olika saker som fäster vid, skriver av eller modifierar dna. Åtminstone en del av resultaten finns tillgängliga i UCSC-genomläsaren så att vi kan titta på vad som försiggår kring våra favoritgener.

Jag har skrivit lite om genetiskt skräp förut: i korthet så är det en väldigt liten del av dna-sekvensen i en stor flercellig organism som faktiskt innehåller instruktioner för några biomolekyler (proteiner och rna). Ytterligare en del innehåller icke-kodande reglerande sekvenser som styr när generna uttrycks. Men lejonparten av genomet är varken eller. Och det är inte bara så att ingen vet vad de gör — många av sekvenerna är tydligt trasiga virussekvenser och andra omflyttningsbara element. Det visar sig att räknar en generöst är det omkring 80% av sekvensen som någon gång skrivs av, interagerar med ett protein eller har vissa modifikationer (som också brukar bäras av dna som används till något). Därmed inte sagt att de gör någon direkt nytta för organismen.

Sean Eddy:

The question that the “junk DNA” concept addresses is not whether these sequences are biochemically “active”, but whether they’re there primarily because they’re useful for the organism. Sequence conservation analyses, including ENCODE’s, consistently indicate that only around 5-20% of the human genome is under detectable selective pressure. Some additional fraction of sequences has probably evolved new human-specific regulatory functions that are not conserved with other closely related species, but ENCODE’s publicized interpretation would require that such nonconserved regulatory sequences account for 80-95% of the genome, far outnumbering evolutionary conserved regulatory sequences. Given the C-value paradox, mutational load, and the massive impact of transposons, the data remain consistent with the view that the nonconserved 80-95% of the human genome is mostly composed of nonfunctional decaying transposons: “junk”.

Litteratur

The ENCODE Project Consortium (2011) A User’s Guide to the Encyclopedia of DNA Elements (ENCODE). PLOS Biology 9 e1001046. doi:10.1371/journal.pbio.1001046

Sean R Eddy (2012) The C-value paradox, junk DNA, and ENCODE (pdf från hans hemsida)

Dan Graur , Yichen Zheng, Nicholas Price, Ricardo B. R. Azevedo, Rebecca A. Zufall, Eran Elhaik. (2013) On the immortality of television sets: “function” in the human genome according to the evolution-free gospel of ENCODEGenome Biology and Evolution doi:10.1093/gbe/evt028

Gyckelblommor och en annan inverterad kromosombit

Mer inversioner! Det här är en artikel jag valde till en faktisk journal club den här veckan: David Lowry & John Willis (2010) A Widespread Chromosomal Inversion Polymorphism Contributes to a Major Life-History Transition, Local Adaptation, and Reproductive Isolation. Jag tycker det kunde vara roligt att titta på den här också; den har ett annat exempel på en inversion med intressanta genetiska effekter. Möt gyckelblomman: Mimulus guttatus. M. guttatus finns tydligen här och där i Sverige där den rymt från någon trädgård, men framför allt bor den i Nordamerika. Den har både fleråriga varianter och annuella varianter, alltså sådana som blommar en säsong och inte övervintrar. Att leva som perenn eller annuell verkar vara en lokal anpassning till miljön. Lowry & Willis har tittat på gyckelblommor längs USA:s och Kanadas östkust. Perennvarianterna finns mest längs kusten (några populationer i inlandet), medan annuella varianter bara finns i inlandet.

Yellow_monkeyflower

(Foto: Christophermluna [CC-BY-3.0], via Wikimedia Commons)

Inversioner — alltså en variant där en bit kromosom vänt sig och sitter i omvänd riktning. Det speciella med dem är att de hindrar rekombination mellan den omvända och den ursprungliga varianten och skapar ett stort block som ärvs tillsammans. Det finns flera exempel på inversioner som gör olika saker och är föremål för naturligt urval; jag vet inte om det är för att just inversioner är särskilt viktiga eller för att de är en typ av stor mutation som går att se på en genetisk karta. Om en ser en grupp markörer som hela tiden ärvs tillsammans tänker en genast på en inversion. Den här artikeln är bara en i en lång serie arbeten med genetisk kartläggning i olika korsningar av M. guttatus, och vid någon punkt har de sett ett stort svart hål i den genetiska kartan och tänkt: aha, inversion.

Så de korsade alltså gyckelblommor från olika populationer med olika levnadssätt och tittade efter rekombinationer och efter markörernas ordning i den inverterade regionen, och mycket riktigt: inversionen är minst två miljoner baser lång och associerad med levnadssätt: perenner har en variant, annueller den andra. Den här artikeln är rolig för att den använder två klassiska typer av experiment för att titta på lokala anpassningars genetik: gemensam trädgård och transplantation. Om en planterar växter från olika miljöer tillsammans, i samma miljö, kan en se hur stor del av skillnaden dem emellan som beror på ärftliga faktorer. Exempel: Björkallén i den genetiska trädgården vid Ultuna. Jag har aldrig varit där, men Erik i Ulleråker har bloggat och tagit en bild. Allén består av björkar från olika delar av Sverige, ordnade från syd till norr. Även om de står i samma miljö så fäller de sina blad vid olika tid och illustrerar björkars lokala anpassning till olika klimat.

Så de prövade att korsa olika populationer med varandra för att testa effekten av inversionen. (Det är alltså länkningskartläggning igen, fast nu bara med en markör) Figur 2 nedan visar tid till blomning i ett gäng olika korsningar: BB är de som har två kopior av perennallelen, AB är en av varje och AA är två kopior av annuellallelen. (Erkännande: Ja, jag skrev ”allel” istället för variant bara för att få skriva ”annuellallelen”.) De med perennvarianten blommar betydligt senare och inversionen verkar ha en additiv effekt (det vill säga, de med allel av varje ligger ungefär mitt emellan de med två lika) och inversionen förklarar 20-45% av skillnaden mellan föräldrarna. Lägg märke till skalan på y-axeln: i medeltal är det lite olika blomningstider i de olika korsningarna, men det är inte helt lätt att jämföra när de har börjat axeln på olika ställen … Det är en viss skillnad i utseende också: se fotografiet.

mimulus_fig2

(Figur 2, Lowry & Willis CC-BY)

Transplantation då: att flytta växter mellan olika miljöer för att se om hur bra de klarar sig. Om de inhemska växterna klarar sig och förökar sig bättre tyder det på att lokal anpassning är i faggorna. Så Lowry & Willis (och de mängder folk som hjälpt till och tackas i Acknowledgements) tog fram korsningar av gyckelblommor från olika ställen med olika varianter av inversionen och planterade ut dem vid kusten respektive inlandet. Och mycket riktigt, de mätte hur många växter av olika genotyp som överlevde, när de blommade och hur många blommor de hade. Gyckelblommor från kusten klarar sig betydligt bättre vid kusten än de från inlandet, och en femtedel eller så av den skillnaden verkar förklaras av inversionen. Svårast är det för kustplantor med perennallelen att klara sig i inlandet: det är för varmt och säsongen för kort för att de ska hinna med att blomma.

Så någonstans i den här två miljoner baser långa dna-biten finns något som har en avsevärd effekt på växtens blomningstid, form och överlevnad i olika miljöer: hela dess livsstil. Om det är en eller flera varianter i inversionen eller om det är en effekt av inversionen själv är inte lätt att veta. Antagligen finns det någon genetisk variant som bidrar till lokal anpassning som råkat hamna på en inverterad kromosombit och så sprids inversionen som en bieffekt av naturligt urval för den varianten. Åter igen: det är ironiskt att innehållet i en inversion blir extra intressant och samtidigt, just för att inversionen hindrar rekombination, väldigt mycket svårare att studera genetiskt.

Litteratur

Lowry DB, Willis JH (2010) A Widespread Chromosomal Inversion Polymorphism Contributes to a Major Life-History Transition, Local Adaptation, and Reproductive Isolation. PLOS Biology 8 e1000500. doi:10.1371/journal.pbio.1000500

Fragment av ett finkgenom: att passa och pussla dna

Häromdagen var det Charles Darwins födelsedag och ett gäng genetiker passade på att publicera en genomsekvens för Geospiza magnirostris, en av de fågelarterna på Galapagos som Darwin träffade på under sin resa med the Beagle. Nu var tjocknäbbade markfinkar kanske inte Darwins viktigaste inspiration, men fåglarna på Galapagos har blivit ett populärt exempel på lokal anpassning med sina specialiserade näbbar.

1839_Zoology_F8.11_fig067

Den som vill bläddra i Rands’ & co genomsekvens för G. magnirostris kan ladda hem en 1.09 Gb zippad fil från fighshare. Men innan vi tänker på att leka med den: vad kan vi vänta oss av en modern genomsekvens? Först och främst: sekvensen är ett utkast som alla från djur och växter. Den är totalt 991 miljoner baser lång men består av strax under 13 000 bitar. G. magnirostris har givetvis inte 13 000 kromsomer utan det är så det blir när en gör modern genomsekvensering. Att sekvensera är mycket snabbare och billigare än det mödosamma arbete som krävdes för att göra de tidiga referenssekvenerna, som människans, hönans m fl. Men det blir ett fragmenterat genom. Det flesta bitarna finns nog där någonstans, men ingen vet i vilken ordning de passar ihop.

Sekvensering kan betyda lite olika saker. När någon pratar om att ”sekvensera tusentals mänskliga genom” eller ”sekvensera området kring SLCO1B3” handlar det om omsekvensering av organismer där det finns en referenssekvens. Efter sekvenseringen, som kan täcka hela genomet eller bara en viss del gäller det att passa in de avlästa dna-bitarna och se var de passar i referenssekvensen, och på vilka ställen det finns genetiska varianter. Passningsproblemet (alignment) är lite besvärligt, särskilt med de miljontals korta sekvenser som kommer ur en modern maskin, men det pussel (assembly) som uppstår när en vill rekonstruera ett genom utan att det finns någon känd referenssekvens är sju resor värre.

Dels genererar en modern maskin väldigt mycket sekvensdata, som sagt, men det är nog inte så farligt jämfört med datamängder som folk i andra branscher hanterar. Tyvärr råkar pusselproblemet dessvärre vara omöjligt. Tänk på dna-sekvenser som upprepas mer än en gång i genomet. Om den avlästa sekvensens (femtio till några hundra baser beroende på teknik) är längre än den upprepade sekvensen är det inget problem. Men om den upprepade sekvensen är mycket längre än den avlästa, och sådana finns det gott om, finns det bitar som inte går att sätta ihop ordentligt.

Problemet kan inte avhjälpas med mer sekvensering, utan kräver att dna prepareras på särskilda sätt. I det här sammanhanget betyder ordet ”bibliotek” en samling korta dna-molekyler från genomet i fråga (antingen i vattenlösning eller inuti en population genmodifierade bakterier). All modern sekvensering använder bibliotek där dna-bitar fragmenteras och paketeras för sekvensering. För att sekvensera över stora repetitiva områden finns det mate-pair eller jump libraries, bibliotek där varje dna-bit är ihopklippt av två kortare med ett hopp i mitten. Långa hopp täcker en längre sekvens utan att behöva läsa av längre bitar och är användbart både för att täcka upprepade sekvenser och sätta ihop korta bitar av ihoppusslad sekvens. Rands & co använde tre typer av bibliotek: enkla fragmenterade sekvenser (300-400 baser långa, 454-metoden) och hopp på 2500 och 4900 baser.

Hur komplett blev det då? Det är väldigt svårt att säga hur bra en genomsekvens är men det går att jämföra litegrann med de fåglar som redan har referenssekvenser: hönan, zebrafinken och kalkonen. Det blev totalt 991 miljoner baser, vilket är ungefär i samma storlekordning som de sekvenserade delarna av andra fågelgenom, och uppskattningsvis 80-90% av genomet. Men när de istället tittade efter kända gener, sådan som både finns hos människa och zebrafink och rimligen borde finnas hos G. magnirostris, så stod ungefär 70% av dem att finna i sekvensen. Så, 70-90% komplett, beroende på om mängden sekvens är en överskattning eller om antalet gener är en underskattning.

Litteratur

Rands, C. M., Darling, A., Fujita, M., Kong, L., Webster, M. T., Clabaut, C., et al (2013). Insights into the evolution of Darwin’s finches from comparative analysis of the Geospiza magnirostris genome sequence. BMC Genomics 14 doi:10.1186/1471-2164-14-95

Nagarajan, N., & Pop, M. (2013). Sequence assembly demystified. Nature Reviews Genetics. doi:10.1038/nrg3367

8650 färgglada bollar: ett genuttrycksnätverk för höns

Genuttryck och höns är ju två av mina intressen, så jag blev givetvis intresserad av Genetic architecture of gene expression in the chicken av Stanley m fl i BMC Genomics. Genetisk arkitektur brukar betyda information om genetiska varianter bakom någon egenskap, men de använder tydligen uttrycket på ett annat sätt. Vad de gjort är ett nätverk som visar korrelationerna i genuttryck mellan 8650 hönsgener, byggt på ungefär 1000 publicerade mikroarrayresultat. Det blir en rätt snygg illustration och en massa öppna frågor. Först något om viktade genuttrycksnätverk!

Metoden de använder kallas WGCNA (det finns ett gäng artiklar om den, se till exempel Langfelder & Horvath 2008 om implementationen i R). Idén är att beskriva hur gener hänger samman genom att se hur deras uttrycksnivåer korrelerar. Det första steget är att göra en stor korrelationsmatris. Så, vilka korrelationer är stora nog att vara intressanta? Istället för att dra en gräns (säg korrelationer större än 0.5 är intressanta) så viktas de med en potensfuktion. Varför en potensfunktion? Jo många nätverk, både biologiska och andra, har det som kallas skalfri struktur där bågarna är fördelade enligt just en potensfunktion. Om nätverket viktas med rätt potens blir det typ skalfritt. En gör alltså antagandet att små korrelationer i allmänhet är oviktiga, men framhäver de stora ännu mer.

Det är god ton bland folk som använder mikroarrayer (”genchip”) och ett krav från många tidskrifter att mikroarraydata publiceras i någon av de offentliga databaserna för sådana. Därför finns det mängder av råa genuttryckdata på internet för den som vill laborera med dem. Det har författarna dragit nytta av och laddat hem varenda hönsarray (av ett visst märke, Affymetrix) de kunnat hitta. Det blev totalt dryga 1000 chip från 67 publicerade experiment på olika vävnader från olika höns. De tog inga hänsyn till under vilka förhållanden genuttrycksvärdena samlades in i första rummet, utan justerade bara för systematiska skillnader mellan experiment.

WGCNA har också ett sätt att dela upp nätverket i moduler (för nördarna där ute: det är hierarkisk klustring, en algoritm för att dela upp det resulterande trädet i grupper och sammanslagning av moduler som är nära varandra). Efter att ha delat upp sitt nätverk i moduler testade de modulerna för anrikning av gener med olika funktioner (”har modulen fler gener av den här typen än det borde bli om de vore slumpvis fördelade”). Här är en Cytoscape-bild av nätverket: varje nod är en gen och varje färg en modul. Mellan noderna går bågar som var och en har en tillhörande vikt. Pilarna pekar ut anrikade funktioner.

chicken_network

(Figur 1, Stanley et al 2013)

Det blir ju en snygg bild och kanske inte så oväntat att antigen processing och immune response som båda har med immunförsvaret att göra eller cytoskelettet och cellcykeln hamnar nära varandra. För min del undrar jag över några saker som inte definieras i artikeln — exakt vad menar de med att en nod är ”among the most highly connected” eller att en modul har ”little or no connections to the rest of the network”. WGCNA har ingen tröskel för när två noder inte anses kopplade, bara bågar med väldigt små vikter. När anser de att en vikt är tillräckligt liten för att inte finnas? En kan lägga märke till att det som pekas ut i diagrammet ovan är ganska allmängiltiga biologiska funktioner. En kan fråga sig om det skulle finnas några skillnader hönsnätverk, ett människonätverk och ett jästnätverk. Går det alls att se några hönsspecifika detaljer? Det finns genuttrycksnätverk som korsar artgränserna, undrar hur mycket det skiljer sig från det här.

Litteratur

Dragana Stanley, Nathan S Watson-Haigh, Christopher JE Cowled, Robert J Moore. (2013) Genetic architecture of gene expression in the chicken. BMC Genomics 14 doi:10.1186/1471-2164-14-13

Peter Langfelder, Steve Horvath. (2008) WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics 9 doi:10.1186/1471-2105-9-559

Skimmelhästar och genetiska bieffekter

En bra sak med genetik är att det är ganska komplicerat. En ännu bättre sak med genetik är att det finns ett praktiskt genetiskt fikonspråk och ett matematiskt språk för att beskriva rätt komplicerade saker. Skimmelanlaget, som får hästar att gråna med ålder är en dominant genetisk variant som identifierades 2008 (Rosengren Pihlberg m fl). Det som hänt är att 4600 baser i närheten av genen STX17, syntaxin 17 duplicerats på ett sätt som ändrar hur den uttrycks … En sekvens som flyttas om och ändrar genuttryck, låter inte det bekant? Nåväl. Där börjar i alla fall artikeln jag tänkte titta på idag: Curik m fl. Complex Inheritance of Melanoma and Pigmentation of Coat and Skin in Grey Horses.

Stutemitfohlen

(Foto: Bloodysunday via Wikimedia Commons)

Skimlar blir inte bara vita, de tenderar också att få hudfläckar utan pigmentering (vitiligo) och de drabbas oftare än andra hästar av melanom, som tur är inte lika aggressiv som mänsklig hudcancer. Men hur hänger egenskaperna ihop — orsakas de av samma gener, kanske rentav av STX17? Författarna har tittat på ungefär 1100 hästar med känt slätträd, dna-testat dem, mätt färg och tittat efter vitiligo och melanom.

Här gör det genetiska fikonspråket entré i form av begreppet heritabilitet: den andel av variationen i någon egenskap som beror på ärftlighet. Variationen ifråga är alltså variation mellan individer, så heritabiliteten gäller en population: bland de här individerna, hur stor andel av variationen kan förklaras av deras släktskap med varandra? Heritabiliteten är ett bråktal från 0 till 1: 0,8 för grå färg, 0,7 för spräcklighet, 0,6 för vitiligo (det här är mycket höga heritabiliteter), 0,4 för melanom är mer modest. (Tabell 2 för den som gillar siffror) Men hur mycket av det är STX17 och hur mycket är andra gener? Eftersom de tagit reda på vilken variant av STX17 (och en annan känd genetisk variant) hästarna har kan de se hur stor del av heritabiliteten som beror på den: mellan 0.2 och 0.5, vilket betyder att även om det klassiska skimmelanlaget är viktigt, så finns det andra varianter, antagligen flera med mycket mindre effekter. Särskilt för spräcklighet, som verkar vara lite sin egen grej.

Nästa steg är den genetiska korrelationen: hur egenskaperna samvarierar och om det faktum att de uppträder tillsammans beror på delade ärftliga anlag. Det kan visa på genetiska bieffekter (pleiotropi är den tekniska termen), när en genetisk variant gör mer än en sak. Och de genetiska korrelationerna mellan egenskaperna är höga (Tabell 3), vilket tyder på samma genetiska grund. De testade att kontrollera för de två kända varianterna och då faller de genetiska korrelationerna till nära noll. Det mesta av korrelationen förklaras alltså av de redan kända generna. Utom vitiligo, för pigmentförlusten och skimmelfärgen har fortfarande en avsevärd genetisk korrelation. Där finns det alltså en annan, delad genetisk grund som inte har med är STX17 att göra.

Det brukar vara svårt att hitta varianter för kvantitativa egenskaper för oftast verkar den genetiska grunden bestå av många varianter med små effekter. Men när det gäller just husdjur så verkar det ibland dyka upp genetiska varianter med dramatiska effekter, som STX17. Författarna nämner ett par varianter hos grisar och kor, och jag kan lägga till den variant för kamstorlek hos höns som vi försöker ringa in och som verkar ha en pleiotrop effekt på både kam och ben.

Husdjur är ju lite speciella, som inte bara är med om naturligt urval från miljön som ändrats drastiskt när de blivit tamdjur — tänk på färgvarianter som ersätter djurets vanliga kamouflage med vitt; det verkar inte så praktiskt i naturen. Förutom det, så är de med om artificiellt urval från människor, som ibland föredrar djur med speciella färger och utseenden. Skimlarnas risk för hudcancer är — som vissa hundars eller katters platta nosar — ett exempel på att det kan finnas genetiska bieffekter av sådana estetiska val, och de är inte alltid de bästa för djuren.

Litteratur

Curik I, Druml T, Seltenhammer M, Sundström E, Pielberg GR, et al. (2013) Complex Inheritance of Melanoma and Pigmentation of Coat and Skin in Grey Horses. PLOS Genetics 9 e1003248. doi:10.1371/journal.pgen.1003248

Pielberg, G. R., Golovko, A., Sundström, E., Curik, I., Lennartsson, J., Seltenhammer, M. H., et al. (2008). A cis-acting regulatory mutation causes premature hair graying and susceptibility to melanoma in the horse. Nature genetics, 40 ss. 1004-1009.

Using R: accessing PANTHER classifications

Importing, subsetting, merging and exporting various text files with annotation (in the wide sense, i.e. anything that might help when interpreting your experiment) is not computation and it’s not biology either, but it’s housekeeping that needs to be done. Everyone has a weapon of choice for general-purpose scripting and mine is R. Yes, this is ”quite trivial if you only think it out”, but it still takes me some time. This script is a work in progress and could certainly be much cleaner and friendlier, but I’ll post it for the benefit of any other user that might google for this kind of thing.

Panther is a protein database with phylogenetic trees of proteins annotated with Gene Ontology terms and organised into pathways. (See the paper in the 2013 database issue of NAR.)  Right now, I’m after pathway classification of chicken proteins. The pathways are also available in some xml formats for systems biologists, but I’m going to use the classification table. It contains all UniProtKB proteins, so it should cover most known genes products.

Note, if you just want to check up on a few genes or a few pathways the Panther web interface seems pretty nice. If you’re after nice pathway diagrams, also check out the website and the SBML format. But for accessing classifications en masse, a treatment in R may be useful.

For this post, I’ve broken down the script into parts. If you want a function for the whole thing, see github.

First, download the classification data for your favourite organism from the Panther ftp.

  panther <- read.delim(filename, sep="\t", head=F,
                        stringsAsFactors=F)

  colnames(panther)[1] <- "gene.id"
  colnames(panther)[3:5] <- c("panther.id", "panther.family",
                            "panther.subfamily")
  colnames(panther)[6:8] <- c("go.mf", "go.bp", "go.cc")
  colnames(panther)[9:10] <- c("panther.ontology", "panther.pathway")

This is a tab separated text file. Since some fields at the end of lines may be left empty, we use read.delim instead of read.table. I add som column names that I think agrees reasonably well with the readme. The first is a  gene id string that contains mapping to Ensembl or Entrez ids, as well as the uniprot accession. It looks something like this:

CHICK|Gene=ENSGALG00000013995|UniProtKB=F1P447

CHICK|ENTREZ=378784|UniProtKB=Q75XU5

Of course, we want the ids as separate columns: stringr does regular expressions in a vectorised manner. str_match gets grouped matches into arrays. (Yes, it can be done with a single regexp, but I don’t take pleasure in that kind of thing.)

  panther$ensembl.id <- str_match(panther$gene, "Gene=(.*)\\|")[,2]
  panther$uniprot.id <- str_match(panther$gene, "UniProtKB=(.*)$")[,2]
  panther$entrez.id <- str_match(panther$gene, "ENTREZ=(.*)\\|")[,2]

The gene ontology fields are terms from each ontology, stringed together and separated by semicolons. This is not the best format for querying, so I’ll make a list of GO ids from each ontology:

  parse.go <- function(go.column) {
    go.list <- str_match_all(go.column, "GO:([0-9]*)")
    names(go.list) <- panther$gene.id.string
    go.list <- llply(go.list, function(x) {if (!is.null(dim(x))) x[,1]})
    return(go.list)
  }
  go.mf <- parse.go(panther$go.mf)
  go.bp <- parse.go(panther$go.bp)
  go.cc <- parse.go(panther$go.cc)

Finally, the pathway column. It says this in the readme:

***Example Pathway:
Inflammation mediated by chemokine and cytokine signaling pathway#Inflammation mediated by chemokine and cytokine signaling pathway#P00031>Integrin#Integrin#P00853;Integrin signalling pathway#Integrin signalling pathway#P00034>Integrin alpha#Integrin alpha#P00941

The format of the pathway information is: pathway_long_name#pathway_short_name#pathway_accession>
component_long_name#component_short_name#component_accession

Explanation of pathway accessions:
Gxxxxx Gene or RNA
Pxxxxx Protein
Sxxxxx small molecules
Uxxxxx others, such as ”unknown”, etc.

For now, I’d like to keep just the pathway id, which is the first id of each pathway entry. Again, there are often multiple entries for the same gene.

  pathway.list <- str_match_all(panther$panther.pathway,
                                "#([G,P,S,U][0-9]*)>")
  names(pathway.list) <- panther$gene.id.string
  pathway.list <- llply(pathway.list,
                        function(x) {if (!is.null(dim(x))) x[,2]})

We might want to have these additional descriptions (names of GO terms, name of pathway) later, but for now, I’ll be satisfied with the unique ids. Let’s package everything in a list, and slap a class attribute on it for good measure.

  panther.classification <- list(data=panther,
                                 go.mf=go.mf,
                                 go.bp=go.bp,
                                 go.cc=go.cc,
                                 panther.pathway=pathway.list)
  class(panther.classification) <- "panther.classification"

Now we can get the pathway ids associated with our favourite gene. Take for example GNB3 which has Uniprot id E1C9D6.

get.pathways <- function(panther, acc) {
  
  ix.uni <- which(panther$data$uniprot.id == acc)
  ix.ens <- which(panther$data$ensembl.id == acc)
  ix.ent <- which(panther$data$entrez.id == acc)
  
  if (length(ix.uni) > 0) {
    ix <- ix.uni
  } else if (length(ix.ens > 0)) {
    ix <- ix.ens
  } else if (length(ix.ent > 0)){
    ix <- ix.ent
  } 
  panther$panther.pathway[[ix]]
  
}
get.pathways(panther.classification, "E1C9D6")

I'll get back to this to maybe do something more useful with it.

Om andra väldigt udda kromosomer

Socialkromosom? Nu har han väl ändå tappat det, han som inte ens brukar vilja skriva om gener för någonting. En könskromosom är inte bara en lite udda kromosom med en gen som styr könsbestämning; det är en väldigt udda kromosom som har en gen som styr könsbestämning. Vi och (de flesta) andra däggdjur kör med XY-systemet: X är stor (160 miljoner baser i referenssekvensen, 800 gener) och Y är liten (60 miljoner baser i referenssekvensen, 60 gener). Den könsbestämmande genen sitter på Y-kromsomen och den har det särdeles fantasilösa namnet SR-Y, sex determining region Y. Och sekvensjämförelser visar att Y verkar komma från X. Den är bara en gravt muterad version.

Platypus

(Förberedande näbbdjur. Foto: Stefan Kraft CC-BY-SA-3.0, via Wikimedia Commons)

Fåglar å sin sida har könskromosomerna Z och W. Z är stor, W är liten.  Och även här verkar den lilla, W, vara en söndermuterad version av Z. Men tvärtom är honan den som har två olika: hon har  ZW och hanen som har ZZ. Och ZW och XY är inte släkt! Om vi tittar på höns och människor (mina två favoritdjur) passar Z med bitar av mänskliga kromsom 9 och 5 och X passar med bitar av hönans kromosom 4 och 1. Okej, så det finns alltså minst två helt olika gener som potentiellt kan styra könsbestämning som dräller omkring i ryggradsdjurens genom. Till skillnad från Y så vet ingen riktigt vilken gen det är som styr könsbestämningen. Men något som är tydligt är att det inte fungerar likadant. Vår utveckling av kön är centraliserad via hormonsystemet: om cellerna får könshormon i blodet vid ett visst tillfälle utvecklar de en hankropp, annars en honkropp. Fåglar däremot verkar ha cellbaserad könsbestämning. Cellen följer sina egna genetiska instruktioner och gör sin egen grej. Det betyder att det kan finnas gynandromorfa fåglar: de är delvis tupp och delvis höna och deras kroppar består av olika ZZ- och ZW-cellpopulationer som utvecklats till kroppsdelar med olika könsegenskaper (Zhao et al 2010).

Duck_billed_platypus_schnabeltier

(Heinrich Harder (1858-1935) via Wikimedia Commons)

Men det blir rörigare! (Jag inser att det ser ut som att jag ljuger för er nu, men det här kommer faktiskt från den vetenskapliga litteraturen (review av Marshall Graves 2008) även om det låter helt vansinningt.) Reptiler har kan ha olika varianter av könskromosomer eller temperaturstyrd könsbestämning. Men näbbdjuren som alltid ska vara värst har inte ett par könskromsomer, utan fem: X1Y1 X2Y2 X3Y3 X4Y4 X5Y5 Och dessutom: näbbdjurens könskromosomer verkar komma från samma delar av genomet som ZW. Så ZW-systemet kan fungera könsbestämmande med den lilla udda könskromosomen hos hanen eller med den lilla udda könskromsomen hos honan. Va?!

Platypus_by_Lewin

(Ett näbbdjur i förvirringen. John Lewin (1770-1819) via Wikimedia Commons)

Men könskromosomer bildas, antagligen, på ett sätt som liknar supergenen kring Gp-9 hos S. invicta: när rekombinationen av någon anledning avstannat kan diverse mutationer ackumuleras och eftersom de alltid ärvs tillsammans med den könsbestämmande varianten finns det utrymme för olika könsspecifika varianter att utvecklas. Sak samma om en genetisk variant på Y gör något som inte fungerar i en honkropp: den befinner sig alltid i hankroppar. Och vice versa för en gen på fåglarnas W. Samtidigt kan lite vad för skräp som helst, till exempel varianter som raderar stora bitar, följa med bara för att de hänger ihop med den könsbestämmande varianten. Ungefär så går gängse teori. Eftersom XY och ZW kommer från helt olika delar av genomet och ändå liknar varandra på så många sätt, verkar det vara något speciellt med könsbestämning. Kromosomer som slår sig i lag med genetisk könsbestämning får vara med om konstiga saker.

Är det något speciellt med den sociala varianten hos S. invicta (Wang et al 2013)? Kommer Sb-kromsomen, som Wang & co kallar kromosomen med den inverterade b-allelen att tappa sekvenser som en Y- eller W-kromosom? Deras hypotes är nej, eftersom den måste passera genom hanmyrorna …

Although the above analyses reveal notable similarities among the Sb, Y and W animal chromosomes, we predict that the rate of gene degeneration in the non-recombining Sb region compared with Y and W animal chromosomes should be relatively slow because of purifying selection in ant haploid males.

Det är nämligen så att hanmyrorna är haploida; de bär bara på en kopia av genomet. S-kromosomen är ingen könskromosom och det här har heller inget med könskromosmer att göra, utan det gäller alla kromosomer. Hanmyrorna har bara en uppsättning. Så om det dyker upp några konstigheter på Sb-kromosomen så har de ingen fungerande SB-kromosom att falla tillbaka på. Därför borde inte Sb kunna mutera lika vilt som en Y- eller W-kromsom. Myror har också sina genetiska konstigheter.

Litteratur

Marshall Graves JA (2008) Weird animal genomes and the evolution of vertebrate sex and sex chromosomes. Annual reviews in genetics 42 ss. 565-586

Wang J, Wurm Y, Nipitwattanaphon M, Riba-Grognuz O, Huang Y-C, Shoemaker D, Keller L. (2013) A Y-like social chromosome causes alternative colony organization in fire ants. Nature 493 ss. 664-668 doi:10.1038/nature11832

Zhao D, McBride D, Nandi S, McQueen HA, McGrew MJ, Hocking PM, Lewis PD, Sang HM, Clinton M. (2010) Somatic sex identity is cell autonomous in the chicken. Nature 464 ss. 237-242