Fler gyckelblommor och deras cis- och transreglerade färger

Detta har hänt: Det finns röda och gula gyckelblommor som bor i olika delar av Californien. I ett område där de möts, en så kallad hybridzon, kan de korsa sig, men populationerna är ändå till största del separerade bland annat för att röda och gula blommor pollineras av olika djur som föredrar blommor av respektive färg. Det vore alltså extra kul att veta vilka genetiska varianter som skiljer röda och gula blommor, eftersom de också är varianter som påverkar reproduktiv isolering mellan olika populationer av gyckelblommor. Anthocyaniner är röda och lila färgämnen i växter; gener inblandade i anthocyaninhantering är såklart huvudmisstänkta. Därför gjorde Streisfeld & Rauscher (2009) en genuttrycksundersökning av de gener som kodar för de proteiner som tillverkar anthocyanin i de här blommorna. Mycket riktigt: regleringen av anthocyaninsyntes skiljer sig mellan blommorna, och genetisk kartläggning ledde Streisfeld & Rauscher till två regioner i genomet. I en av dem ligger genen Dfr, som kodar ett av enzymerna i kedjan. Det var en väldigt rimlig hypotes att någon variant i Dfr skulle vara inblandad, men så verkar inte vara fallet. Tillbaka till ritbordet: finns det någon annan gen, nära Dfr, som kan vara inblandad istället? Där står vi när den dagens artikel börjar.

Det är inte meningen att den här bloggen ska handla helt om gyckelblommor, men det är var också för bra att inte skriva om: genetisk kartläggning, genuttryck, naturligt förekommande varianter som påverkar egenskaper. Växter eller djur spelar mindre roll: den här artikeln är ett typiskt exempel på genetisk forskning jag är intresserad av. (Det är i alla fall inte precis samma art som förra gångerna: Mimulus aurantiacus istället för guttatus …) Även om jag är förtjust i diagram och grafer för egen del är jag ganska usel på att titta noga på dem. Därför tänkte jag presentera den här artikeln i form av några av dess figurer. Det är också en anledning att jag föredrar att skriva om open access-artiklar, där det är fritt fram att återanvända bilder. Alla figurerna kommer från Streisfeld, Young & Sobel (2013) och omfattas av Creative Commons Attribution-licensen.

Figur 1 — en karta över hybridzonen och ett par fotografier av blommorna. Gula blommor finns åt öster och de röda åt väster.

journal.pgen.1003385.g001

Det här är en karikatyr av hur det röda färgämnet anthocyanin tillverkas i en växt: en serie kemiska rekationer som katalyseras av olika enzymer och som regleras av ett gäng transkriptionsfaktorer (delvis oklart vilka de alla är). Flera av generna i den här kedjan uttrycks olika mycket i röda och gula blommor — de reglerande transkriptionfaktorerna är de geometriska formerna till höger, och det är bland dem som den eftersökta genen (antaligen) finns. Det här är vad som på fikonspråk heter trans-reglering. Trans betyder typ ”på andra sidan”, och det betyder i det här sammanhanget att en gen regleras från någonannanstans i genomet, av en annan gen. Motsatsen är cis-reglering: reglering på nära håll. En transreglerande genetisk variant är något som påverkar en gen så att den i sin tur påverkar de andra gener som den reglerar.

journal.pgen.1003385.g002

Så de gav sig ut på jakt efter den saknade transreglerande genen. Anthocyaninsyntes är rätt väl beskrivet i en del andra växter, så de började med att leta upp potentiella transkriptionsfaktorer. Det finns ingen referenssekvens för Mimulus aurantiacus, så de vände sig mot släktingen M. guttatus och fann tre lovande kandidater som de kunde hitta uttryckta i blommorna.

Nästa figur är ett släktträd men inte av arter utan av gener, baserat på hur lika proteinernas aminosyrasekvenser är varandra. Pilarna pekar ut de tre misstänkta transkriptionsfaktorerna MaMyb1, 2 och 3. Generna heter alltså Myb1, 2 och 3 och de två första bokstäverna står för Mimulus aurantiacus. De jämförs med andra gener från andra arter, bland annat några ”Mg” (Mimulus guttatus) och ”At” (Arabidopsis thaliana; backtrav). MaMyb1 och MaMyb2 hamnar på samma gren som andra gener som är kända för att reglera anthocyanin i M. guttatus.

journal.pgen.1003385.g003

Tre gener alltså… Dags för lite genetisk kartläggning. Den misstänkta genen måste ligga ganska nära Dfr, på fikonspråk: vara länkad till Dfr. Hur avgör en det? Jo, genom att typa genetiska markörer nära MaMyb1, MaMyb2, MaMyb3 och Dfr, och se hur ofta det förekommer rekombinationer emellan dem; rekombinationsfrekvens är ju ett mått på genetiskt avstånd. De tittade i en experimentkorsning mellan röda och gula blommor, och MaMyb1 och 3 var inte länkad till Dfr, men avståndet till MaMyb2 var ungefär 11 cM (vilket är typ 11% rekombinationsfrekvens). Okej, har genotyp på MaMyb2 någon effekt på anthocyanin? Panel A visar effekten av genotyp hos MaMyb2 (svart stapel) och Dfr (vit stapel) i samma korsning — och mycket riktigt, MaMyb2 är associerat med anthocyanin. Dfr är det inte!

Panel B visar samma typ av resultat, men i naturligt förekommande hybrider från hybridzonen ovan. Det finns ett tydligt mönster där en viss genotyp (färg i diagrammet) på markörer i MaMyb2-genen överensstämmer med gul respektive röd färg. Markörer nära Dfr har inget tydligt mönster.

journal.pgen.1003385.g004

Okej, så om en vill veta ifall en gen utför en viss funktion, i det här fallet gör blommor röda, vad är ett bra experiment? Slå ut genen och se om funktionen också går sönder! Virus-induced gene silencing är en metod som lite liknar genterapi. Växter tolererar naturligtvis ogärna virus, och metoden går ut på att sätta in en kopia av en växtgen i ett virus, så att växten överreagerar och stänger ner uttrycket av den egna genen av bara farten. Nästa bild, panel A, visar ett exempel på resultatet. När MaMyb2 tystas blir en blomma som normalt skulle bli röd (om inte helt så delvis) gul:

journal.pgen.1003385.g006

Panel B visar att den synliga effekten också är där på molekylär nivå. De svarta visar genuttryck i normala blommor och de vita genuttryck i de virusbehandlade: Inte bara MaMyb2 utan också andra gener i anthocyaninsystemet är nedreglerade — vilket pekar på att MaMyb2 reglerar dem.

Så, MaMyb2 är definitivt inblandad i färg. Om den stängs av har det en effekt både på genuttryck och färg. Panel C — och det är den sista bilden vi ska titta på idag — visar resultatet av ett experiment för att pröva om det är just detta som händer med en naturligt förekommande genetisk variant i de röda och gula blommorna.

Tricket är att med pyrosekvensering (en sekvenseringsteknik som är lite annorlunda den den jag brukar prata om, men den har sin speciella roll) går det faktiskt att mäta genuttryck på allelnivå — i heterozygota individer (blommor som har både allelen för röda och för gula blommor), vilken av allelerna är det som uttrycks mest? De grå staplarna visar andelen av den röda allelen — och den är nära 1. Den gula allelen uttrycks nästan inte alls.

Det här är ett utmärkt tillfälle att introducera en teknisk term att skrämma vänner och bekanta med: detta betyder att MaMyb2 har en så kallad cis-eQTL. QTL står för quantitative trait locus — en plats i genomet (ett locus) som påverkar en kvantitativ egenskap. e:et står för expression — alltså genuttryck. Cis betyder som sagt att varianten är nära. Panel C tyder på att det finns en genetisk variant i närheten som påverkar regleringen av MaMyb2 och i sin tur blommornas färg. Sammantaget ger den här artikeln utmärkt stöd för en (ännu okänd) variant nära MaMyb2 som en av de två generna som förklarar skillnaden i färg mellan gula och röda blommor. Och där slutar vi för idag.

Litteratur

Streisfeld MA, Rausher MD. (2009) Altered trans-Regulatory Control of Gene Expression in Multiple Anthocyanin Genes  Contributes to Adaptive Flower Color Evolution in Mimulus aurantiacus. Molecular biology and evolution 26 ss. 433-44 doi: 10.1093/molbev/msn268

Streisfeld MA, Young WN, Sobel JM (2013) Divergent Selection Drives Genetic Differentiation in an R2R3-MYB Transcription Factor That Contributes to Incipient Speciation in Mimulus aurantiacus. PLoS Genet 9 e1003385 doi:10.1371/journal.pgen.1003385

Att tolka agarosgel

Några ord och bilder om att tolka och tyda resultaten av agarosgelelektrofores:

tolka_gel

I bilden står det:

Martins guide till att tolka agarosgel

Vanlig gel efter pcr (för sekvensering eller dylikt): produkt av förväntad längd; ett band från specifik pcr. Inget band i negativ kontroll. Korta svaga primer dimer-band kan vara acceptabelt. Stege.

Storleksbestämning (t.ex. gentypning med mikrosatelliter): Olika alleler ger olika lång produkt (ofta en liten skillnad). Två band — heterozygot. Det behövs en negativ kontroll här också, men jag ritade en för liten gel.

Den ökända fruktade tomma gelen: Kolla dina anteckningar och beräkningar! Gör om pcr-reaktionen minst en gång innan du blir förtvivlad! Avsaknad av band betyder inte att sekvensen saknas. För att visa avsaknad av den sökta sekvensen krävs smarta positiva kontroller.

Lycka till i labbet!

ENCODE, 80% och varför det mesta av skräpet fortfarande är skräp

ENCODE, encyclopedia of DNA elements, är på tapeten igen: det är några som skrivit en rätt elak kritisk artikel. Den är i och för sig open access så att alla kan läsa den, men jag rekommenderar den här i stället: Sean R Eddy, The C-value paradox, junk DNA, and ENCODE. Den är skriven i faq-/katekesform och är mer pedagogisk än Graur & co.

Vad är det då folk är så arga på? Tja, den här lilla filmen sammanfattar hypen kring ENCODE-projektet ganska väl: en gigantisk robot som slår cancer på käften. Och hela genomet är fullt av aktivitet ”even the parts we used to think of as junk”. Suck.

(Själv samlar jag mod för att redigera eller åtminstone diskutera svenska Wikipedias sida som är lika missvisande.)

Å andra sidan: den här artikeln ger en ganska fin sammanfattning av vad projektet egentligen gjorde. Alltså, precis som namnet antyder, är det fråga om en encyklopedi över dna-element i det mänskliga genomet. För ett par andra förträffliga varelser se modENCODE. Det ENCODE (och många andra) mätte var olika typer av aktivitet: olika saker som fäster vid, skriver av eller modifierar dna. Åtminstone en del av resultaten finns tillgängliga i UCSC-genomläsaren så att vi kan titta på vad som försiggår kring våra favoritgener.

Jag har skrivit lite om genetiskt skräp förut: i korthet så är det en väldigt liten del av dna-sekvensen i en stor flercellig organism som faktiskt innehåller instruktioner för några biomolekyler (proteiner och rna). Ytterligare en del innehåller icke-kodande reglerande sekvenser som styr när generna uttrycks. Men lejonparten av genomet är varken eller. Och det är inte bara så att ingen vet vad de gör — många av sekvenerna är tydligt trasiga virussekvenser och andra omflyttningsbara element. Det visar sig att räknar en generöst är det omkring 80% av sekvensen som någon gång skrivs av, interagerar med ett protein eller har vissa modifikationer (som också brukar bäras av dna som används till något). Därmed inte sagt att de gör någon direkt nytta för organismen.

Sean Eddy:

The question that the “junk DNA” concept addresses is not whether these sequences are biochemically “active”, but whether they’re there primarily because they’re useful for the organism. Sequence conservation analyses, including ENCODE’s, consistently indicate that only around 5-20% of the human genome is under detectable selective pressure. Some additional fraction of sequences has probably evolved new human-specific regulatory functions that are not conserved with other closely related species, but ENCODE’s publicized interpretation would require that such nonconserved regulatory sequences account for 80-95% of the genome, far outnumbering evolutionary conserved regulatory sequences. Given the C-value paradox, mutational load, and the massive impact of transposons, the data remain consistent with the view that the nonconserved 80-95% of the human genome is mostly composed of nonfunctional decaying transposons: “junk”.

Litteratur

The ENCODE Project Consortium (2011) A User’s Guide to the Encyclopedia of DNA Elements (ENCODE). PLOS Biology 9 e1001046. doi:10.1371/journal.pbio.1001046

Sean R Eddy (2012) The C-value paradox, junk DNA, and ENCODE (pdf från hans hemsida)

Dan Graur , Yichen Zheng, Nicholas Price, Ricardo B. R. Azevedo, Rebecca A. Zufall, Eran Elhaik. (2013) On the immortality of television sets: “function” in the human genome according to the evolution-free gospel of ENCODEGenome Biology and Evolution doi:10.1093/gbe/evt028

8650 färgglada bollar: ett genuttrycksnätverk för höns

Genuttryck och höns är ju två av mina intressen, så jag blev givetvis intresserad av Genetic architecture of gene expression in the chicken av Stanley m fl i BMC Genomics. Genetisk arkitektur brukar betyda information om genetiska varianter bakom någon egenskap, men de använder tydligen uttrycket på ett annat sätt. Vad de gjort är ett nätverk som visar korrelationerna i genuttryck mellan 8650 hönsgener, byggt på ungefär 1000 publicerade mikroarrayresultat. Det blir en rätt snygg illustration och en massa öppna frågor. Först något om viktade genuttrycksnätverk!

Metoden de använder kallas WGCNA (det finns ett gäng artiklar om den, se till exempel Langfelder & Horvath 2008 om implementationen i R). Idén är att beskriva hur gener hänger samman genom att se hur deras uttrycksnivåer korrelerar. Det första steget är att göra en stor korrelationsmatris. Så, vilka korrelationer är stora nog att vara intressanta? Istället för att dra en gräns (säg korrelationer större än 0.5 är intressanta) så viktas de med en potensfuktion. Varför en potensfunktion? Jo många nätverk, både biologiska och andra, har det som kallas skalfri struktur där bågarna är fördelade enligt just en potensfunktion. Om nätverket viktas med rätt potens blir det typ skalfritt. En gör alltså antagandet att små korrelationer i allmänhet är oviktiga, men framhäver de stora ännu mer.

Det är god ton bland folk som använder mikroarrayer (”genchip”) och ett krav från många tidskrifter att mikroarraydata publiceras i någon av de offentliga databaserna för sådana. Därför finns det mängder av råa genuttryckdata på internet för den som vill laborera med dem. Det har författarna dragit nytta av och laddat hem varenda hönsarray (av ett visst märke, Affymetrix) de kunnat hitta. Det blev totalt dryga 1000 chip från 67 publicerade experiment på olika vävnader från olika höns. De tog inga hänsyn till under vilka förhållanden genuttrycksvärdena samlades in i första rummet, utan justerade bara för systematiska skillnader mellan experiment.

WGCNA har också ett sätt att dela upp nätverket i moduler (för nördarna där ute: det är hierarkisk klustring, en algoritm för att dela upp det resulterande trädet i grupper och sammanslagning av moduler som är nära varandra). Efter att ha delat upp sitt nätverk i moduler testade de modulerna för anrikning av gener med olika funktioner (”har modulen fler gener av den här typen än det borde bli om de vore slumpvis fördelade”). Här är en Cytoscape-bild av nätverket: varje nod är en gen och varje färg en modul. Mellan noderna går bågar som var och en har en tillhörande vikt. Pilarna pekar ut anrikade funktioner.

chicken_network

(Figur 1, Stanley et al 2013)

Det blir ju en snygg bild och kanske inte så oväntat att antigen processing och immune response som båda har med immunförsvaret att göra eller cytoskelettet och cellcykeln hamnar nära varandra. För min del undrar jag över några saker som inte definieras i artikeln — exakt vad menar de med att en nod är ”among the most highly connected” eller att en modul har ”little or no connections to the rest of the network”. WGCNA har ingen tröskel för när två noder inte anses kopplade, bara bågar med väldigt små vikter. När anser de att en vikt är tillräckligt liten för att inte finnas? En kan lägga märke till att det som pekas ut i diagrammet ovan är ganska allmängiltiga biologiska funktioner. En kan fråga sig om det skulle finnas några skillnader hönsnätverk, ett människonätverk och ett jästnätverk. Går det alls att se några hönsspecifika detaljer? Det finns genuttrycksnätverk som korsar artgränserna, undrar hur mycket det skiljer sig från det här.

Litteratur

Dragana Stanley, Nathan S Watson-Haigh, Christopher JE Cowled, Robert J Moore. (2013) Genetic architecture of gene expression in the chicken. BMC Genomics 14 doi:10.1186/1471-2164-14-13

Peter Langfelder, Steve Horvath. (2008) WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics 9 doi:10.1186/1471-2105-9-559

Mer om myrorna med socialkromosomen

Vet inte riktigt om det framgår av bloggen, men själv använder jag genuttrycksmetoder för att studera diverse egenskaper hos höns. Så den korta biten om genuttryck i artikeln om myrorna intresserade mig lite extra. Och för några år sedan publicerade några av samma gäng en artikel om genuttryck hos samma myror. Och till skillnad från Nature-artikeln är den här i PLOS Genetics, vilket betyder att den är fri att läsa och kopiera för alla: Genome-Wide Expression Patterns and the Genetic Architecture of a Fundamental Social Trait.

De jämförde mRNA mellan BB– och Bb-arbetsmyror från 20 kolonier med fler än en drottning. Resultatet var inte direkt överväldigande: de fann 39 gener vars uttryck skilde sig åt, bland dem gener som liksom Gp-9 kodar för luktreceptorer. Men när de väl hittat den stora inversionen som gör området till Gp-9 till en supergen faller de här resultaten i ett lite annat ljus: det visar sig nämligen att 70% av de gener som skiljer sig i uttryck ligger just i området med inversionen vilket är betydlig fler än de ungefär 5% av alla gener de mätte som ligger där. (Med liknande resultat för jämförelser mellan drottningar och hanmyror i den nya artikeln.)

Det här är ett enrichment test (kanske anrikningstest på svenska) vilket är väldigt vanligt i genuttrycksbranschen. Det jämför helt enkelt hur många gener av en viss kategori som dyker upp med hur många en skulle vänta sig av ren slump. Ofta är det inget vidare test, men det här tror jag är en situation där det passar rätt bra. Det finns ingen särskild anledning att tro att gener som skiljer sig mellan myror med olika variant av Gp-9 skulle ligga på något särskilt ställe i genomet, om det inte vore för den här typen av stora omflyttningar runt genen själv. Det är förmodligen ett exempel på att när inversionen väl har hänt och det inte kan bli några överkorsningar i området så kommer alla möjliga varianter att ärvas tillsammans med Gp-9-allelen, just för att de inte kan rekombineras bort från varandra.

Litteratur

Wang J, Ross KG, Keller L. (2008) Genome-Wide Expression Patterns and the Genetic Architecture of a Fundamental Social Trait. PLOS Genetics 4 e1000127. doi:10.1371/journal.pgen.1000127

En supergen och en socialkromosom

Om en lite udda kromosom med en gen som styr könsbestämning kan heta könskromosom så borde en lite udda kromosom med en gen som styr socialt beteende kunna heta socialkromosom. Det är nämligen så att vissa myror har en sådan. Det är dagens artikel: John Wang m. fl. A Y-like social chromosome causes alternative colony organization in fire ants. Solenopsis invicta (red imported fire ant) är en art myror som finns kommer från Sydamerika men finns lite varstans i Nordamerika, Asien och Oceanien. De lever i kolonier med drottning och sterila arbetare men de finns i två varianter: kolonier som bara har en drottning och kolonier som kan ha flera. Det förstnämnda kallas ett monogynt samhälle och det senare ett polygynt. Är det inte lustigt hur ord som ”polygyn” eller ”promiskuös” betyder helt olika saker beroende på vilken djurart det handlar om? Turligt nog för myrorna är det inte så lätt att dra några direkta paralleller mellan deras sociala system och mänskliga samhällen. De slipper förhoppningsvis de skvallertidningsrubriker som bland annat zebrafinkar och sorkar drabbas av.

Hur som helst varierar det sociala systemet inom arten och det verkar styras av ett mendelianskt anlag som kartlagts till genen Gp-9 som kodar för en luktreceptor. Kanske ändras något i den kemiska kommunikationen mellan drottning och arbetsmyror. Den har två varianter: låt oss följa författarna och kalla dem B och b. Arbetsmyror är diploida som vi: alla kromosomer i två kopior. Hanarna är haploida: bara en kopia. Samhällen av bara BB-myror har en drottning, medan samhällen där det också finns Bb-myror kan ha flera. Myror med genotypen bb verkar inte överleva, hanar som bara har b klarar sig. Förutom det sociala är det andra skillnader mellan myror med olika Gp-9-varianter: storlek, lukt, hur många ägg drottningar lägger och hur många spermier hanar producerar. Tidigare genetiska undersökningar av området kring Gp-9 tyder på att det finns ett block där det inte blir någon överkorsning; det är det som är rubrikens supergen. Det finns några exempel på supergener (”super” i det här fallet betyder bara att det är större enheter än en gen som tillsammans orsakar en bunt korrelerade egenskaper) i blommor och fjärilar.

Så författarna vill veta om Gp-9 verkligen ligger i en supergen. Hur tar en reda på det? Genom att leta efter rekombinationer, naturligtvis! Här kommer en gammal bild från Thomas Hunt Morgan igen. Här är ett kromosompar under meios, även känt som reduktionsdelning, även känt som när ägg eller spermier bildas:

Morgan_crossover_1

Det här är alltså vad som händer lite då och då när celler delar sig för att bilda könsceller: kromosomerna i ett par som vanligtvis ärvs som enheter bryts upp, korsas och sätts ihop igen. Resultatet blir två rekombintanta kromosomer. Om det finns en massa genetiska varianter som skiljer kromosomerna åt (och det finns det; alla realistiska genom är fulla med variation) så bär de rekombinanta kromosomerna på nya kombinationer av variationer som inte fanns förut. Så hur kan en se rekombinationer? Jämföra genetiska markörer mellan föräldrar och avkomma! Författarna sekvenserade dna från familjer av drottningar och deras söner. De använde en sorts massivt parallell sekvensering som läser av DNA-sekvensen på väldigt många korta bitar från godtyckliga ställen i genomet och hittade några tusen genetiska markörer. Markörer som ligger på samma kromosom tenderar att ärvas tillsammans, så de kunde se 16 grupper av markörer som motsvarar S. invictas 16 kromosomer. Och på en av kromosomerna ett område helt utan rekombinationer som de uppskattade till 12.7 miljoner baser långt. Där är supergenen.

Områden utan rekombination kan bero på att den ena kromosomen (det skulle i det här fallet vara b-varianten) drabbats av någon storskalig mutation som gör att den inte passar med den andra (B) längre och därför inte kan korsas med den. Så hur kan en se storskaliga omflyttningar på en kromosom? Måla kromosomen och titta på den i mikroskop! De tillverkade alltså fluorescensmärkta dna-bitar med olika färg som täckte supergenen och tittade på kromosomer från myror med B- och b-varianterna i fluorescensmikroskop. Och mycket riktigt: på b-kromosomer kommer sekvensen i omvänd ordning. Det är alltså en bit dna som sitter vänt åt motsatt håll: en stor inversion, minst 9.3 miljoner baser. Det är en mutation som kan hända då och då vid överkorsning och förhindrar i fortsättningen överkorsning mellan kromosomer med och utan inversionen.

Så det är frågan om en stor mutation som tar upp ungefär halva kromosomen och muterar och ärvs som en enhet. Paradoxalt blir det samtidigt extra intressant att veta vad olika varianter inom supergenen gör och extra svårt att få veta, just för att den muterade delen av b-kromosomer alltid ärvs tillsammans som ett block.

Litteratur

Wang J, Wurm Y, Nipitwattanaphon M, Riba-Grognuz O, Huang Y-C, Shoemaker D, Keller L. (2013) A Y-like social chromosome causes alternative colony organization in fire ants. Nature 493 ss. 664-668 doi:10.1038/nature11832

Mer om de blå äggskalen: haplotyper och galla

Det var en sak jag skyndade över lite snabbt häromdagen i min post om höns som lägger blå ägg. Det är ju inte bara fråga om en variant som orsakar blå ägg, utan två populationer med två olika varianter med samma typ av virussekvens som båda stör samma gen. Det tycker i alla fall jag är rätt coolt.

Retrovirus förökar sig genom att sätta in kopior av sitt genom i värdcellens kromosomer. Endogena retrovirus (erv) är rester av retrovirus som någon gång råkat infektera könsceller och på så sätt blivit en ärftlig del av genomet och sådana virusrester är en stor del av alla stora genom. (Även om hönans genom inte är lika repetitivt som många andra djurs är det ändå fullt med kopior av diverse virusbitar.) EAV-HP är ett erv hos höns, som liknar avian leukosis virus, ett hönsretrovirus som orsakar tumörer. Erv är ofta ganska söndermuterade och EAV-HP saknar mycket riktigt både en av tre typiska retrovirusgener och delar av de andra generna. Tydligen har det lyckats kopieras ändå, antagligen med hjälp av andra virus som är aktiva men som inte är så nogräknade med vad de skriver av.

Wang & co tittade på tre sorters höns med blå ägg: två från Kina och en sort från Chile. Alla tre hade en kopia av ett endogent retrovirus av typ EAV-HP som satt sig strax framför genen … Men inte på riktigt samma ställe! Titta på en del av figur 3C. Det skiljer ett tjugotal baser mellan insättningsställena:

wang_fig3c

(Wang et al 2012, figur 3c. CC:BY)

Kan det verkligen ha hänt två gånger? För att ta reda på det tittade författarna på andra varianter i området kring insättningsstället. Diploida organismer, som vi och hönsen, bär ju runt på två kopior av varje kromosom. En haplotyp är enkelt en bit av en kromosom där det finns flera varianter vars alleler ärvs tillsammans. Det finns nästan inga dna-tester som ger direkt information om haplotyperna, utan genotypen är en kombination av de två haplotyperna. Men det går att göra en kvalificerad gissning vilka haplotyper som finns i en population med hjälp av frekvenserna av olika genotyper och korrelationerna emellan dem. Och det har författarna gjort i ett antal hönspopulationer.

I extramaterialet (Tabell S3) finns resultatet av en haplotypanalys. Av någon anledning verkar Araucana och Lushi, som är den Chilenska och en av de kinesiska blåvärpande hönssorterna saknas i tabellen. Men det går att se direkt från allelfrekvenserna i tabell 1 att varianterna omkring insättningen bör se rätt olika ut:

wang_table1

(Wang et al 2012, utsnitt ur tabell 1. CC:BY)

Det verkar som att de två mutationerna sitter på olika haplotyper — det verkar alltså som att de uppstått oberoende av varandra. Det får mig att undra lite — är det något med just den här regionen som får endogena retrovirus att lättare integrera där (slumpvis insättning behöver ju inte betyda likafördelad sannolikhet över hela genomet), och finns det möjligen några miljöförhållanden som de här kinesiska och chilenska hönsen varit med om som innebär naturligt urval för blå äggskal? Författarna nämner några olika möjliga funktioner med äggskalets färg, men jag vet inte hur viktiga de är.

Vad gör den här genen då? Proteinet som SLCO1B3 kodar för är ett transportprotein som är känt för att uttryckas i leverceller och bland är känt för att transportera bilirubin. Bilirubin finns i gallan, bildas av nedbrutet hemoglobin och ger bland annat urin och gamla blåmärken sin gula färg. Ett annat ämne från nedbrutet hemoglobin, biliverdin, ger äggskalen en blå ton, så det är inte så långsökt att virusstyrt överuttryckt SLCO1B3 i hönsens äggledare orsakar blå äggskal.

Litteratur

Wang Z, Qu L, Yao J, Yang X, Li G, et al. (2013) An EAV-HP Insertion in 5′ Flanking Region of SLCO1B3 Causes Blue Eggshell in the Chicken. PLoS Genet 9. doi:10.1371/journal.pgen.1003183

Hönsgenetik: Blå äggskal och gamla virusbitar

Hönsgenetik! Hurra! Den här bloggen tjänar ju som min privata journal club, och idag tänkte jag titta närmare på en artikel som kom häromdagen om genetiken bakom blå äggskal: Wang m fl. An EAV-HP Insertion in 5′ Flanking Region of SLCO1B3 Causes Blue Eggshell in the Chicken. De har isolerat två genetiska varianter som orsakar blå äggskal, genom att påverka samma gen, i höns från olika delar av världen. I båda populationerna är det en rest av ett retrovirus som satts in i närheten av genen SLCO1B3, som kodar för ett protein som transporterar organiska joner i celler. Varianten ändrar på uttrycket av genen så att den uttrycks på ställen den inte gör i höns med vita ägg.

De flesta höns lägger ägg med vita eller bruna skal, men det finns några sorter som lägger blå ägg, bland annat i Kina och Chile. Det gäller nu inte klarblå ägg, snarare vita lite blåtonade. Blå äggskal är en klassisk mendeliansk egenskap: den har enkelt arv med ett dominant anlag för den blå färgen. Mendelianska egenskaper är betydligt mer lätthanterliga än kvantitativa egenskaper med många bakomliggande genetiska varianter, men det kan bli rörigt nog ändå. Skoj att se den molekylära grunden för ett till hönsgenetiskt fenomen.

Till experimentet! Artikeln börjar med en serie referenser till tidigare kartläggningar som lokaliserat varianten till ett område på kromosom 1. Författarna gjorde en finare kartläggning av ett 3.3 miljoner baser långt område i en korsning av Dongxiang-höns. Det är en kinesisk hönssort som har individer som lägger blå ägg och en del som lägger bruna, och de korsade tuppar homozygota för den blå allelen med hönor som lägger bruna ägg. Resultatet av kartläggningen blev en mindre region på 120 000 baser. Den innehöll fyra gener — alltså fyra kandidater att undersöka vidare.

Så, ett relativt enkelt om än inte idiotsäkert sätt att leta efter underliggande genen är att mäta genuttryck, alltså hur mycket de fyra generna skrivs om till rna. Författarna gjorde flera olika uttrycksmätningar — först av alla fyra, vilket ledde dem att titta närmare på SLCO1B3. Det här är figur 1 från artikeln och den visar dem alla samt en bild av de blå äggen. Genuttryck skiljer sig mellan vävnader, så var ska en börja leta? De letade i prover från höns’ äggledare för det är där äggskalen bildas.

journal.pgen.1003183.g001

(Figur 1 från Wang et al (2012), PLOS Genetics, Creative commons: BY)

De använde först omvänd transkription och PCR med agarosgel (det är B) i figuren: BS är Dongxiang-höns med blå skal, Dongxiang-NBS är höns utan och ett vitt band betyder att det finns PCR-produkt, alltså mätbart genuttryck. Som synes i bilden är det bara en gen där höns med blått äggskal uttrycker genen och de utan saknar den: SCLO3B1. RT-PCR, som den här tekniken heter, är inte alls dumt men dåligt på att kvantifiera mängder ordentligt. Därför gick de vidare med realtids-PCR (C i figuren). Där verkar det som SLC3B1 uttrycks i flera olika höns med blå skal, men inte i ett antal med vita skal.

Om du är pyrosekvenseringsnörd vill jag gärna prata med dig om D- och E-delen av figuren. (Det blir lite extra rörigt eftersom den snp de mäter är G/T och följs av en rad T.) F visar fluorescensmärkt in situ-hybridisering — det betyder att märkta rna-strängar som matchar genen ifråga sätts till tunna vävnadsprover för att se om de fastnar, så det börjar fluorescera där genen uttrycks. Och här fluorescerar det mer i prover från höns som lägger blå ägg. Fluorescensbilden är snygg, men den nämns mest i förbigående och jag är inte säker på vad som är skillnaden mellan de grönaktiga och blåaktiga bilderna. Åter igen, om det är någon in situ-hybridiseringsnörd som läser får du gärna höra av dig!

När författarna hade en gen gav de sig på att sekvensera den och dess omgivning i jakt på den orsakande genetiska varianten. Sedan jämförde de olika hönsraser med och utan blå ägg för att se vilka varianter som associerar med blå äggskal — och alltså kan vara den orsakande varianten. De hittade ett antal enkla genetiska varianter (snp:ar) i området, men ingen av dem passade. Däremot hittade de ett cirka 4200 baser långt endogent retrovirus, det vill säga en gammal genetisk rest av ett virus som satt in sig strax före genen och antagligen stör någon reglerande sekvens. Virussekvensens spridning i hönspopulationer var helt associerad med blått äggskal. Alltså ser det här ut att vara ännu ett exempel på hur genetiskt skräp kan orsaka nya egenskaper.

Litteratur

Wang Z, Qu L, Yao J, Yang X, Li G, et al. (2013) An EAV-HP Insertion in 5′ Flanking Region of SLCO1B3 Causes Blue Eggshell in the Chicken. PLoS Genet 9. doi:10.1371/journal.pgen.1003183

Att ta fram DNA och RNA (Så går det till, del 5)

Hittils har den här serien handlat om olika saker vi kan göra med nukleinsyror i labbet, och allihop har förutsatt att vi har en hyfsat ren lösning DNA eller RNA. Hur får vi en sådan?

Det finns massor av olika recept för att isolera DNA och RNA. Demonstrationen ovan är nog den enklaste tänkbara, men den ger knappast särskilt rent DNA. Jag tänkte att vi kunde titta på de två kanske viktigaste principerna. Varje tillverkare med självaktning har en egen variant som heter något snarlikt.

Alla metoder går i stora drag ut på att bryta sönder provet och på något sätt rena fram DNA och RNA från proteiner, fetter, kolhydrater och så vidare som finns i provet. I videon ovan är de två stegen 1) mosa jordgubbarna i en påse med diskmedel och 2) fälla DNA med alkohol och salt.

Det som varierar mest mellan olika prover är det första steget: på något sätt måste vi ta sönder provet för att cellerna ska öppnas och nukleinsyran komma ut. Hur mycket våld som krävs beror på vilken sorts prov det är frågan om — bakterieceller som växer i en näringslösning brukar är lättare att ta sönder en stammen från en växt eller kanske en bit ben.

Allt bygger på att nukleinsyrorna har andra kemiska egenskaper än proteiner och fetter. Båda metoderna fungerar för DNA eller RNA med lite olika justeringar. Men helt går det inte alltid att skilja DNA från RNA och för att vara på den säkra sidan finns det specifika DNA- eller RNA-nedbrytande enzymer som går att använda.

DNA och RNA är rätt lika molekyler, men DNA tål betydligt mer. Problemet med RNA är dels att det bryts sönder om vattenlösningen det ligger i värms upp. Dessutom är omgivningen full av RNAser, RNA-nedbrytande enzymer. De finns överallt (alla celler behöver kunna bryta ner RNA) och de är inte lätta att inaktivera. Därför är damm, fingrar och värme de främsta hoten mot våra dyrbara RNA-prover. Därför kan vi som jobbar med RNA ibland vara lite stirriga.

Fenol-kloroformextraktion

Extraktion är en gammal hederlig kemisk teknik. Det bygger på att polära och opolära vätskor — som olja och vatten — inte löser sig i varandra utan bildar två lager. I korthet går fenol-kloroformextraktionen till såhär: vi tar vårt sönderslagna prov som innehåller lite allt möjligt jox — proteiner, fett, kolhydrater, salter och så vidare — och blandar den med fenol och guanidintiocyanat. Guanidintiocyanat är ett salt som inaktiverar de flesta protiner och skyddar därför RNA från att bli nedbrutet av RNaser. Så häller vi på ett organiskt lösningsmedel som kloroform (vilket får en att känna sig som en gammal filmskurk).

Nu börjar själva extraktionen! Vi skakar som sjutton och väntar på att faserna ska separera igen. Det är som olja och vatten, men här är den organiska fasen tyngre än vattnet och lägger sig alltså under vattenfasen. Snart bildas två lager: det undre (som i vissa tillverkares version är rosafärgat — hurra!) är den organiska fasen och innehåller DNA och proteiner; det övre genomskinliga är en vattenlösning och där finns RNA. Det är bara att suga upp den övre fasen med en pipett och gå vidare med den.

Sedan fäller vi fram det från vattenlösningen. Det är samma sak som i videon ovan, men resultatet blir mycket renare, eftersom vi gjort en  extraktion först. Med hjälp av en alkohol och lite salt får vi nukleinsyran att falla ut och bilda en vit pellet i botten. Nukleinsyran är inte särskilt löslig i alkohol, så vi kan tvätta pelleten med etanol en eller ett par gånger. När den är tillräckligt ren suger vi bort etanolen, låter pelleten torka och löser upp den i vatten. Voilá — en hyfsat ren RNA-lösning!

Fenol-kloroform är en klassisk metod; den kan också användas till DNA-isolering och till att rena DNA efter olika enzymbehandlingar — men det tar tid och kemikalierna är duktigt giftiga.

Spinnkolonnmetoder

En kolonn är, i allmänhet, ett rör proppat med något material som används för att göra någon sort kemisk separation. En spinnkolonn är en liten kolonn som passar i en centrifug så att det går att snurra den och få vätska att passera genom den snabbare. Spinnkolonner för DNA- och RNA-isolering innehåller kisel, där nukleinsyran fastnar.

I korthet går det till såhär: vi blandar vårt prov med en lösning med ett guanidinsalt (åter igen) och häller i kolonnens ena ände. Nukleinsyran fastnar i kolonnen, men det andra går rakt igenom. Vi sköljer igenom kolonnen några gånger med etanolbaserad tvättlösning för att få bort så mycket skräp som möjligt. Sedan, när vi vill att nukleinsyran ska släppa, sätter vi till en vattenlösning eller i vissa kolonner bara rent vatten. Det som kommer ut fångar vi upp i ett rör. Klart!

Den här beskrivningen är mycket kortare än den ovanstående, och i allmänhet går det nog också fortare än fenol-kloroformmetoden. Vad som funkar bäst? Det beror förmodligen på provet och vad vi vill få ut av det. Väldigt korta RNA-strängar fastnar inte så bra i en spinnkolonn. Vissa prover kan bli renare i den ena metoden eller den andra — ibland krävs både och: först fenol-kloroform och sedan en spinnkolonn. Ibland kan det duga med någon enklare isoleringsmetod som mer liknar det som händer med  jordgubbarna i videon.

Med det tror jag vi behandlat allt som krävs för PCR-baserad DNA- och RNA-analys. Så, kära läsare, vad ska vi ta upp härnäst?