Något om genetiskt skräp och evolution

Hört talas om skräp-DNA någon gång? Uttrycket kommer sig av att lejonparten av genomet inte verkar koda för något — varken proteiner eller RNA-molekyler. Det myntades någon gång på sjuttiotalet, men är rätt ute numera. Artiklar om icke-kodande DNA tenderar ha någon mening i inledningen om hur okunniga de var på sjuttiotalet. Det är klart, det klingar kanske lite arrogant att avfärda större delen av genomet som skräp. Men det ligger ändå fortfarande något i det, även om det dyker upp fler icke-kodande sekvenser med kända funktioner.

För det är skillnad på funktion och funktion, och många av de här sekvenserna gör saker som inte är ett dugg konstruktiva för organismen. Vi har mött dem tidigare: transposonerna och (som det heter i Karolinskas hemska översättning) de andra omflyttningsbara DNA-segmenten. De fungerar som en sort parasiter: det enda de kan är att kopiera sig själva och flyttar sig omkring i genomet. Det gör att de kan bli fler och fler på organismens bekostnad. Det vill säga, en del längre varianter, som verkar stamma från retrovirus, har den förmågan — och kodar för omvänt transkriptas. Det finns också kortare varianter som förmodligen uppstått genom att olika oskyldiga RNA-molekyler skrivits om till DNA med hjälp av omvänt transkriptas från en längre retrotransposon.

Vi behöver inte vara medicinska genetiker för att räkna ut att diverse osorterade DNA-sekvenser som sättes in här och där i genomet kan ställa till problem — till exempel genom att störa regleringen av någon viktig gen. Å andra sidan öppnar samma process för nya intressanta mutationer. Organismen gör å sin sida sitt bästa för att hålla de omflyttningsbara elementen i schack. Epigenetisk reglering är, som sagt, en möjlighet.

Det vanligaste parasitiska elementet hos oss människor heter Alu. Det är en av de kortare varianterna, stammar från ett RNA, saknar förmågan att kopiera sig själv, men innehåller en del andra intressanta sekvenser. Den har ett ställe där retinolsyrareceptorn kan binda — vilket gör att en Alu-insättning skulle kunna koppla en gen till vitamin A. Men i det här sammanhanget gäller det en koppling till en annan process: RNA-splitsling (splicing).

Hos oss eukaryoter ligger de kodande delarna av generna utspridda lite här och där. De kodande bitarna kallas exoner, och de icke-kodande bitarna emellan introner. När en gen ska uttryckas skrivs den först om till ett långt RNA med både introner och exoner. Sedan klipps intronerna bort och exonerna sätts ihop till det ett fullständigt mRNA. Det är alltså splitsningen, och den styrs av signalsekvenser.

Men, mycket riktigt, Alu innehåller sekvenser som liknar splitsningssignalerna! Det betyder att Alu-bitar, men några små förändringar, kan leta sig in i mRNA. Vi återkommer till vad de skulle kunna göra där. Först: artikeln — Widespread establishment and regulatory impact of Alu exons in human genes (det är en open access-artikel, så det är bara att hugga in) av Shihao Shen m. fl., som kom ut i Proceedings of the National Academy of Sciences of the USA i februari.

Det är ett till att börja med ett sekvenseringsbaserat arbete, men det är inte DNA-sekvensering utan RNA-sekvensering som gäller. Det betyder alltså att använda massivt parallell sekvensering på cDNA istället för genom-DNA. Det är dels ett sätt att mäta genuttryck — genom att bara räkna hur många gånger en viss mRNA-sekvens dyker upp. Men det är också att sätt att titta på RNA-molekylernas sammansättning, alltså ett utmärkt sätt att se ifall Alu-sekvenser förekommer i mRNA eller inte.

Med en genomdatabas hjälp ställde de sig frågan: Om kända Alu-sekvenser splitsades in, hur skulle skarven mellan Alu och resten av mRNA:t se ut — och sedan letade de efter de skarvarna i ett par publicerade samlingar RNA-sekvenseringsdata från människa.

De tittade efter total 627 Alu-exoner, varav 287 förekom i proverna mRNA. Det är alltså 627 Alu-sekvenser i gener som någon har sett förut, men bara 287 som användes i den här vävnaden — lillhjärnan, cerebellum. Det illustrerar att även för en så väl beskriven organism som människan, där det finns en bra referenssekvens och massor av information om vilka sekvenser som uttrycks, har den samlade biologiska vetenskapen ganska dålig koll på vad som försiggår.

(Förresten, om vi skulle välja en annan teknik som vi behandlat tidigare till att kontrollera resultaten av sökningen i RNA-sekvenser? Rätt gissat, RT-PCR, vilket är precis vad Shen & co också gjorde.)

Nåväl. Det sitter alltså Alu-sekvenser i ett gäng mänskliga gener. Vad är det med det? Jo, en ny bit mRNA, särskilt i början av genen, kan ändra hur mycket protein som produceras från RNA. Att mäta mRNA är en sak, men att få reda på hur mycket protein som produceras är lite knivigare. Det Shen & co gjorde var en teknik med cellodling och reportergener. En reportergen är en gen som är lätt att detektera — det brukar vara ett protein som fluorescererar eller på något annat sätt ger lysande eller färgade celler.

Reportergenen kopplas ihop med den reglerande sekvensen som ska testas. Mängden protein från reportergenen kan mätas som ljus från cellerna och det återspeglar den reglerande sekvensens effektivitet. Nåväl, det fina med det här är att det går att testa olika varianter av sekvensen, genom att införa olika ändringar. Av 15 gener som de prövade var det 10 där Alu-sekvensen verkade göra någon skillnad. En Alu-sekvens i början av mRNA kan alltså göra skillnad. Lite experimenterande med extra stoppkodoner tyder dessutom på att de gör det genom att skapa extra läsramar som börjar i Alu-exonen och tävlar med den kodande genens läsram.

De la också märke till att påfallande många av generna med Alu-exoner tillhörde ZNF-familjen, en serie transkriptionsfaktorer, gener som i sin tur reglerar uttrycket av andra gener. Den här familjen innehåller ett gäng gener som är specifika för primater och som har uttryck som skiljer sig mellan schimpanser och människor. Det är inte direkt några vattentäta bevis, men åtminstone en suggestiv antydan att de där små bitarna av eländigt skräp skulle ha en del i skillanden mellan oss och andra stora apor.

Hur som helst, det här är ett exempel på vad återanvänt genetiskt material kan åstadkomma. Det händer betydligt större — och konstigare saker — under evolutionens gång än enstaka ändrade baser.

Litteratur

Shen S, Lin L, Cal JJ, Jiang P, Kenkel EJ, Stroik MR, Sato S, Davidson BL, Xing Y. (2011) Widespread establishment and regulatory impact of Alu exons in human genes. PNAS 108 ss. 2837-2842

En sjungen introduktion till maternella effekter

(Eller moderseffekter, som jag nog hellre skulle säga — det är hur som helst förmodligen den vanligaste och viktigaste formen av icke-genetiskt biologiskt arv. Nu finns det, åtminstone bland oss däggdjur, tydligen faderseffekter också, bland annat i form av genetisk prägling. Men modern har fortfarande betydligt fler möjligheter att överföra saker till det växande embryot.)

Just like two strands of DNA are spirally entwined, your nature and your nurture inspiringly combined…

Är det inte generna så är det hormonerna

Bara en kort grej apropå sista tidens vetenskapsnyheter:

Det är lätt att få föreställa sig att biologer som studerar beteende bara är intresserade av genvarianter och kemikaliehalter och inte bryr sig om saker som uppväxt, inlärning och interaktioner med andra individer. Men det är helt enkelt inte sant.

Faktum är att både det sociala och inlärning är beteendebiologins favoritämnen. Den klassiska etologins stjärnor som Niko Tinbergen och Konrad Lorenz sysslade just med sånt, till exempel. Tinbergen observerade steklar på väg hem till sina bon i sanden och ägnade sig åt att flytta runt pinnar, kottar och stenar för att se vilka drag i omgivningen som steklarna la på minnet för att hitta hem. Lorenz levde med kajor och gäss, lyssnade till deras läten, lärde känna deras personligheter och försökte begripa deras sociala liv. Djurs personlighet är för övrigt fortfarande i allra högsta grad på modet.

Edward Wilson, som myntade ordet sociobiologi på 70-talet — och som ironiskt nog verkar vara känd antingen som en älskvärd naturvän eller som en ämnesimperialistisk buffel — ägnade sig mest åt insektssamhällen. (Att människor, hur mycket vi än försöker, sannolikt inte kan fungera i ett samhälle som är organiserat som ett insektssamhälle är utan tvivel essentialistiskt sagt, men det är nog också sant.)

Vi må vara dualister eller materialister, tro att medvetande är något skilt från kroppen, är identiskt med processer i kroppen eller en bieffekt av sådana processer, men jag tror att vi alla måste vara överens om att det finns en koppling mellan hur nervsystemet fungerar, hur vi beter oss och hur vi känner oss. Beteendebiologens jobb är att försöka reda ut hur det där hänger ihop, på valfritt plan, men helst flera. (Det överlappar såklart andra vetenskapsfält — inte för inte är det ofta psykologer, etologer och evolutionsbiologer gått varandras vetenskapliga ärenden.)

Därför måste vi bli förvånande över hur ofta nyheten — som på sista tiden om oxytocin, bland annat — om att något beteende eller någon känsla hänger ihop med en ökande eller minskande utsöndring av något visst hormon, en elektrisk potential i något nervknippe eller ökat blodflöde i en viss del av hjärnan möts med överraskning. Vad sjutton skulle vi annars vänta oss — är inte det centrala nervsystemet beteendeorganet nummer ett? Det vore väl mer förvånande om det inte hände någonting i hjärnan eller med hormonerna när människor blev kära, ledsna eller fastnade i en bilkö?

Det kan tänkas att det finns beteenden som verkligen orsakas av genvarianter: alltså, i en viss given situation kan det vara en genetisk variant i någon gen som avgör om individen kommer göra si eller så. Hormonsystemet, däremot, är ett signalsystem — att säga att testosteron orsakar ett visst beteende eller någon annan fysiologisk reaktion, som vi ju ibland säger är inte någon vidare förklaring. (Om det inte är någon som smugit sig upp och givit individen ifråga en testosteroninjektion.) Varför utsöndrades det testosteron?

Precis som aktivering i en del av nervsystemet, en förändring i genuttryck eller någon annan fysiologisk förändring så är den ingen vidare förklaring i sig själv. Den uppstår alltid som en effekt av något annat — något i den inre eller yttre miljön.

Det går inte att göra allt på en gång. Ibland försöker vi hålla generna konstanta och studerar inavlade laboratoriestammar eller cellinjer. Ibland gör vi vårt bästa för att kontrollera miljön, tittar på skillnad i gener och kanske deras interaktion med någon enskild miljöfaktor. Men målet är inte att avskriva miljön, utan beskriva så bra det bara går hur saker händer — hur organismen reagerar i ögonblicket; hur den utvecklas under sin livstid för att kunna fungera så; och hur beteendet ifråga vuxit fram med evolutionen.

Att ta fram DNA och RNA (Så går det till, del 5)

Hittils har den här serien handlat om olika saker vi kan göra med nukleinsyror i labbet, och allihop har förutsatt att vi har en hyfsat ren lösning DNA eller RNA. Hur får vi en sådan?

Det finns massor av olika recept för att isolera DNA och RNA. Demonstrationen ovan är nog den enklaste tänkbara, men den ger knappast särskilt rent DNA. Jag tänkte att vi kunde titta på de två kanske viktigaste principerna. Varje tillverkare med självaktning har en egen variant som heter något snarlikt.

Alla metoder går i stora drag ut på att bryta sönder provet och på något sätt rena fram DNA och RNA från proteiner, fetter, kolhydrater och så vidare som finns i provet. I videon ovan är de två stegen 1) mosa jordgubbarna i en påse med diskmedel och 2) fälla DNA med alkohol och salt.

Det som varierar mest mellan olika prover är det första steget: på något sätt måste vi ta sönder provet för att cellerna ska öppnas och nukleinsyran komma ut. Hur mycket våld som krävs beror på vilken sorts prov det är frågan om — bakterieceller som växer i en näringslösning brukar är lättare att ta sönder en stammen från en växt eller kanske en bit ben.

Allt bygger på att nukleinsyrorna har andra kemiska egenskaper än proteiner och fetter. Båda metoderna fungerar för DNA eller RNA med lite olika justeringar. Men helt går det inte alltid att skilja DNA från RNA och för att vara på den säkra sidan finns det specifika DNA- eller RNA-nedbrytande enzymer som går att använda.

DNA och RNA är rätt lika molekyler, men DNA tål betydligt mer. Problemet med RNA är dels att det bryts sönder om vattenlösningen det ligger i värms upp. Dessutom är omgivningen full av RNAser, RNA-nedbrytande enzymer. De finns överallt (alla celler behöver kunna bryta ner RNA) och de är inte lätta att inaktivera. Därför är damm, fingrar och värme de främsta hoten mot våra dyrbara RNA-prover. Därför kan vi som jobbar med RNA ibland vara lite stirriga.

Fenol-kloroformextraktion

Extraktion är en gammal hederlig kemisk teknik. Det bygger på att polära och opolära vätskor — som olja och vatten — inte löser sig i varandra utan bildar två lager. I korthet går fenol-kloroformextraktionen till såhär: vi tar vårt sönderslagna prov som innehåller lite allt möjligt jox — proteiner, fett, kolhydrater, salter och så vidare — och blandar den med fenol och guanidintiocyanat. Guanidintiocyanat är ett salt som inaktiverar de flesta protiner och skyddar därför RNA från att bli nedbrutet av RNaser. Så häller vi på ett organiskt lösningsmedel som kloroform (vilket får en att känna sig som en gammal filmskurk).

Nu börjar själva extraktionen! Vi skakar som sjutton och väntar på att faserna ska separera igen. Det är som olja och vatten, men här är den organiska fasen tyngre än vattnet och lägger sig alltså under vattenfasen. Snart bildas två lager: det undre (som i vissa tillverkares version är rosafärgat — hurra!) är den organiska fasen och innehåller DNA och proteiner; det övre genomskinliga är en vattenlösning och där finns RNA. Det är bara att suga upp den övre fasen med en pipett och gå vidare med den.

Sedan fäller vi fram det från vattenlösningen. Det är samma sak som i videon ovan, men resultatet blir mycket renare, eftersom vi gjort en  extraktion först. Med hjälp av en alkohol och lite salt får vi nukleinsyran att falla ut och bilda en vit pellet i botten. Nukleinsyran är inte särskilt löslig i alkohol, så vi kan tvätta pelleten med etanol en eller ett par gånger. När den är tillräckligt ren suger vi bort etanolen, låter pelleten torka och löser upp den i vatten. Voilá — en hyfsat ren RNA-lösning!

Fenol-kloroform är en klassisk metod; den kan också användas till DNA-isolering och till att rena DNA efter olika enzymbehandlingar — men det tar tid och kemikalierna är duktigt giftiga.

Spinnkolonnmetoder

En kolonn är, i allmänhet, ett rör proppat med något material som används för att göra någon sort kemisk separation. En spinnkolonn är en liten kolonn som passar i en centrifug så att det går att snurra den och få vätska att passera genom den snabbare. Spinnkolonner för DNA- och RNA-isolering innehåller kisel, där nukleinsyran fastnar.

I korthet går det till såhär: vi blandar vårt prov med en lösning med ett guanidinsalt (åter igen) och häller i kolonnens ena ände. Nukleinsyran fastnar i kolonnen, men det andra går rakt igenom. Vi sköljer igenom kolonnen några gånger med etanolbaserad tvättlösning för att få bort så mycket skräp som möjligt. Sedan, när vi vill att nukleinsyran ska släppa, sätter vi till en vattenlösning eller i vissa kolonner bara rent vatten. Det som kommer ut fångar vi upp i ett rör. Klart!

Den här beskrivningen är mycket kortare än den ovanstående, och i allmänhet går det nog också fortare än fenol-kloroformmetoden. Vad som funkar bäst? Det beror förmodligen på provet och vad vi vill få ut av det. Väldigt korta RNA-strängar fastnar inte så bra i en spinnkolonn. Vissa prover kan bli renare i den ena metoden eller den andra — ibland krävs både och: först fenol-kloroform och sedan en spinnkolonn. Ibland kan det duga med någon enklare isoleringsmetod som mer liknar det som händer med  jordgubbarna i videon.

Med det tror jag vi behandlat allt som krävs för PCR-baserad DNA- och RNA-analys. Så, kära läsare, vad ska vi ta upp härnäst?

Epigenetik: gul päls och en svansknyck, de bästa exemplen på epigenetiskt arv

Om epigenetik bara vore några mekanismer för genreglering skulle det knappast vara ett sådant liv om epigenetiken. SVT:s vetenskapsmagasin skulle inte låta ett par nyblivna föräldrar visa upp sin dotter medan en allvarlig berättarröst pratade om epigenetikens hypotetiska påverkan på barnets lysande framtid. Det är något mer på gång.

Epigenetik är allt som går i arv från cell till dottercell och som inte kan förklaras av DNA-sekvens eller gemensam yttre miljö — och påverkar vilka gener cellen ska uttrycka. Epigenetiska skillnader kan inte (vad vi vet) ändra på proteiners uppbyggnad — de ändrar alltså inte genernas sekvens — men annars kan de potentiellt förändra det mesta i hur cellen fungerar. En förändring i en enda gens uttrycksnivå kan, som vi strax ska se, ha rätt konstiga effekter.

Det finns en rad exempel på ärftlighet som inte låter sig förklaras av DNA-sekvenser eller gemensam yttre miljö, och vi borde återkomma till några av dem. Men det är väldigt få där vi har någon aning om hur det går till och kan knyta det till någon av de epigenetiska mekanismer som beskrivits på molekylär nivå — DNA-metylering till exempel.

Såvitt jag vet finns det två riktigt bra exempel på epigenetiskt arv där någon verkligen lyckats ta reda på vad som försiggår. Båda handlar, kanske föga förvånande, om små gnagare: gula möss och andra möss med en knyck på svansen. Båda handlar dessutom om DNA-metylering och om en särskild kul form av mutation. (Vi har stött på den tidigare, i Craig Venters med flera Mycoplasma-bakterie med syntetiskt tillverkat genom.)

Mössens genom, liksom de flesta andra djur och växters, är nämligen fullt med transposoner: upprepade sekvenser som kodar för gener som kan klippa och klistra i genomet — och sätta in kopior av sig själva! Det är ganska absurt. Hur vi fått alla de här eländiga självkopierande generna kan diskuteras, men en del av dem stammar helt klart från retrovirus. Det hör till retrovirusens livscykel att sätta in en kopia (ett så kallat provirus) av sitt hela sitt genom i värdcellens kromosomer. Om proviruset råkar hamna i könscellerna kan de gå i arv till nästa generation och bli en del av värdorganismens genom. Det är en sjukt osannolik händelse, men uppenbarligen händer det då och då. Det verkar inte finnas något vettigt sätt för värdorganismen att bli av med de här virusresterna. Istället använder den DNA-metylering som ett sätt att hindra dem från att uttryckas.

Så, mössen i fråga har drabbats av bitar av retrovirus sin agouti– respektive axin-gen. I de första mössens fall gör mutationen att de får ovanlig färg. Agouti är namnet på den vanliga bruna färgen, och också namnet på en gen som har med pigmentering att göra. Möss som har genvarianten agouti viable yellow har olika färg, från gula (eller kanske mer gulbruna) till normalbruna. Och — mycket riktigt — färgen går i arv från mor till ungar.

Hur kan vi då vet att det inte är vanligt hederligt genetiskt arv? Morgan & co (1999) studerade inavlade agouti viable yellow-möss som är genetiskt identiska. (Inavlade möss av olika slag finns att beställa på postorder; det är förmodligen både en följd av och anledning till att så många jobbar med möss.)

Nästa mus har en variant av genen axin som kallas axin fused (Rakyan m.fl. 2003). Möss med just den varianten kan ha knyckar på sin svans. Precis som färgen på agouti viable yellow-mössen går antalet böjningar av i arv. Men inte bara från mor till unge, utan också på fädernet. Inte nog med det, DNA-metyleringen finns både i vanliga celler i kroppen (somatiska celler, säger biologer ibland) och i spermier (som ju är könsceller), och skulle alltså kunna gå direkt i arv den vägen.

Särskilt hos däggdjuren har fostret betydligt fler kontaktytor med modern än med fadern, så det finns många möjliga vägar för icke-genetiskt arv. Men när det gäller hanen finns det inte mer än det som ryms i spermien, som bär på kromosomerna men förhållandevis lite proteiner och RNA. Det lustiga är att agouti viable yellow också har samma mönster i spermier som somatiska celler, fast den inte går i arv på fädernet.

(axin fused-möss från Whitelaw-laboratoriet, varifrån båda artiklarna jag refererar kommer; bilden kommer från den här artikeln och är Creative commons-licensierad.)

Sammanfattningsvis är det inte helt olikt fallet med patient P2: han fick genterapi mot betatalassemi men genterapivektorn som var baserad på ett virus, råkade sätta in en genetisk förstärkare mitt i HMGA2-genen. Därmed knöts HMGA2-uttryck till den en ny reglerande sekvens. I viable yellow-mössens fall råkade transposonen sätta in sig i en gen som reglerar pigmentering. Agoutigenens uttryck kopplas alltså till uttrycket av transposonen. Och i och med att transposonen regleras av DNA-metylering regleras aguoti också av DNA-metylering.

Förresten, varför är det en stor grej att metyleringen av axin fused går igen i spermier? När könscellerna bildas nollställs normalt DNA-metyleringen. Epigenetiska markörer har ju med celldifferentiering att göra, och könscellerna ska bilda det nya embryot — ett enda befruktat ägg ska ge upphov till alla celltyper i den nya kroppen. Men all DNA-metylering försvinner inte. Vi har redan tagit upp genetisk prägling — vissa gener metyleras och uttrycks olika beroende på om de går i arv från mamma eller pappa. Och det verkar också finnas vissa lysande undantag, sekvenser som inte får sina metyleringar raderade, bland annat agouti viable yellow och axin fused.

Det är sådana sekvenser — vilka de nu är och hur många nu kan vara — som öppnar för ärftliga DNA-metyleringar. Om de dessutom på något sätt är känsliga för miljöpåverkan öppnar de för ärftliga förvärvade egenskaper. Det är åtminstone teoretiskt möjligt att de kan ligga bakom andra epigenetiska ärftliga saker. Vad är det då som utmärker de här sekvenserna? Ingen vet. Hur som helst, djurs och växters genom är fulla av retrotransposoner och det är mycket möjligt att en del av dem får gener att fungera som de här två musgenerna. Men i så fall har ingen hittat dem än.

Litteratur

Morgan HD, Sutherland HGE, Martin DIK, Whitelaw E. (1999) Epigenetic inheritance at the agouti locus in the mouse. Nature Genetics 23, ss. 314-318.

Rakyan VK, Chong S, Champ ME, Cuthbert PC, Morgan HD, Luu KVK, Whitelaw E. (2003) Transgenerational inheritance of epigenetic states at the murine AxinFu allele occurs after maternal and paternal transmission. Proceedings of the National Academy of Sciences 100, ss. 2538-2543.

Sökmotorfrågor: Var på kromosom sju sitter genen för cystisk fibros?

Häromdagen var det någon läsare som hittade hit genom att ställa den frågan till en sökmotor. Så, var sitter genen för cystisk fibros? Cystisk fibros är en av de få sjukdomar där det verkligen finns en klar genetisk orsak — en gen där en del varianter (några av dess alleler, som det brukar heta) gör att proteinet inte fungerar som det ska, med en massa obehagliga konsekvenser. Alltså, alla har vi genen, men en del har råkat få dubbla kopior av en allel som orsakar sjukdomen.

OMIM (Online Mendelian Inheritance in Man) är ett bra ställe att börja för att få en uttömmande och tungrodd sammanfattning om en sådan gen. Om vi söker på cystisk fibros hittar vi CYSTIC FIBROSIS TRANSMEMBRANE CONDUCTANCE REGULATOR; CFTR. Det finns också en OMIM-post om sjukdomen i sig. Inte ens här är det riktigt så enkelt att det är en ensam gen — dels finns det flera olika besvärliga alleler av CFTR-genen, dels verkar det finnas andra gener som modifierar effekten av CFTR.

OMIM har en länk till en genetisk karta, men istället kan vi söka på CFTR-genen i en genombläddrare som Ensembl. Där hittar vi en beskrivning av genen, inklusive dess plats i referenssekvensen: på kromosom sju vid ungefär 117 megabaser.

agcgaaaaagtggaaaacagcgaacgcattaacggc (Så går det till, del 4)

Nu är det ungefär åtta år sedan det mänskliga genomprojektet avslutades. Nu pratas det med jämna mellanrum om den sköna nya värld när alla kommer kunna sekvensera sitt genom. (Vad i hela friden vi ska med våra individuella genomsekvenser till är fortfarande en öppen fråga. Jag föreslår att skriva ut den på ett ungefär trehundra mil långt toalettpapper att släpa runt på.) Samtidigt strömmar det in nya organismer, senast tror jag kakao och jordgubbe, som fått en referenssekvens. Tidningar brukar oftast kalla det ”kartläggning” eller att ”knäcka den genetiska koden”, men de menar nästan alltid sekvensering.

Att ta fram en referenssekvens är fortfarande ett hårt jobb, men det är när den är klar som den verkliga sekvenseringen kan börja. Då blir det lätt för de som är intresserade av någon viss gen eller viss kandidatregion att sekvensera den och hitta intressanta genetiska variationer. Och den moderna sekvenseringen, som snabbt läser av DNA från många slumpvis valda delar av genomet och sedan lappar ihop det till en hyfsat heltäckande sekvens, behöver en bra referenssekvens.

Sådana massivt parallella sekvenseringsmetoder (med namn som Illumina Genome Analyzer, SOLiD och Roche 454) kommer starkt för tillfället. Men Sangersekvensering är förmodligen fortfarande den viktigaste metoden, vid sidan av alternativet pyrosekvensering. (Det finns andra tidigare metoder och den numera typ övergivna Maxam-Gilbertsekvenseringen, men de är drygare.) Alltså — Sangers enzymatiska sekvensering med avbrutna kedjor!

Vi börjar med en primer — precis som i PCR, fast det behövs bara en — en kort DNA-sekvens som passar där vi vill börja läsa. Så kommer DNA-polymeraset, utgår från primern och bygger upp en ny sträng som kopierar den gamla. Den nya strängen byggs upp av nukleotider — en av baserna A, T, G, C som sitter ihop med en sockermolekyl. Så långt allt gott. Det är bara det att vi satt till en andel stoppnukleotider — nukleotider som är kemiskt lite annorlunda och inte går att bygga vidare på.

När polymeraset råkar sätta in en stoppnukleotid är den strängen slut. Stoppnukleotiden är dessutom märkt med en fluorescent molekyl i en av fyra färger, en för varje bas. Resultatet är en blandning av strängar av olika längd som fluorescerar (avger ljus när den blir belyst) i olika färg beroende på vilken bas de slutar med.

Så, om vi bara kan sortera DNA-fragmenten i storleksordning kan vi läsa av sekvensen som en serie av fluorescenta ljus. Hur storlekssorterar vi? Med gelektrofores! Sekvenseringmaskiner brukar använda ett tunnt glasrör med gel och ha en fast detektor som DNA-bitarna passerar igenom. När de åker förbi lyser detektorn på dem med laser och ser vilken färg som lyser tillbaka.

Sedan ritar den ett diagram med en kurva för varje färg, där sekvensen framträder som en bergskedja av toppar i olika färger. (Eller snarare, det gör ett datorprogram på datorn kopplad till maskinen — om någon vet om ett trevligt fritt program för Sangersekvensering, berätta för mig!)

Den här metodens nackdel är att den bara kan sekvensera en ganska kort sekvens i taget, upp till kanske tusen baspar. Början av sekvensen brukar också vara svår att läsa av. För att konstruera en referenssekvens behövs det alltså ohyggliga mängder sekvenseringsreaktioner; det mänskliga genomet är ungefär tre miljarder baser. Å andra sidan går det fort att köra en reaktion, och numera är bara att stoppa sitt prov (till exempel en renad PCR-produkt) i ett kuvert och skicka till något av alla de företag som gör sekvensering för typ 100 kr per reaktion.

(Rubriken är ett exempel på den genetiska koden. Proteiner byggs upp av aminosyror, som motsvarar en trio av baspar i en gen. Trion kallas kodon — och vilka kodoner som motsvarar vilken aminosyra kallas den genetiska koden. ”GCT” står för aminosyran alanin, till exempel. I en annan, inte genetisk utan mänsklig, kod förkortas varje aminosyra med en bokstav ur alfabetet. Rubriksekvensen skapades med webbprogrammet Reverse Translate — nej, jag kan det inte i huvudet. Den kan översättas tillbaka till exempel med Transeq.)

Om genterapi, att sätta in en gen och råka störa en annan

De flesta ”gener för sjukdomar” är, som vi tidigare konstaterat, genetiska markörer där en variant har ett statistiskt samband med en gen som påverkar risken för en sjukdom på något oftast okänt, sällan helt entydigt, sätt. Men det finns också några få, synnerligen ovanliga, ärftliga genetiska sjukdomar, där en trasig variant av en gen orsakar bekymmer.

Cystisk fibros är en känt exempel — ett trasigt jontransportprotein ger alla möjliga otäcka effekter. Huntingtons sjukdom, där en trasig variant av proteinet huntingtin ansamlas i nervcellerna, är ett annat. När den genetiska grunden för en sådan sjukdom är beskriven är det tyvärr ändå inte alltid klart vad man ska göra med kunskapen. Ibland ger den genetiska grunden en bättre bild av vad det är sjukdomen gör — men ofta är det tvärtom, att sjukdomen är bättre känd än genen, och att det därför är sjukdomsbilden som bidrar med upplysningar om hur genen fungerar. Om det saknade proteinet normalt utsöndras i blodet går det möjligen, som med blödarsjuka eller diabetes, att tillverka det och ge som ersättning.

Men själva genen går det inte att göra något åt, utom med genterapi. Genterapi är precis vad det låter som: att försöka bota genetiska sjukdomar genom att ge patienten nytt genetiskt material — i det enklaste fallet tillföra genen för det protein som är trasigt. Det är en spännande idé som varit på tapeten sedan sjuttiotalet. Det har varit många framsteg sedan dess, men det är ändå svårt; det kommer inte vara ett rutiningrepp inom fem år, om vi säger så.

Fortsätt läsa

Epigenetik: En gång Lysenko, idag lincRNA

Låt oss ta ett exempel på något coolt som någon gjort med RT-PCR. Det handlar också om ett epigenetiskt fenomen med en ganska obskyr historia. Säg hej till Trofim Lysenko:

Lysenko är känd för att ha varit Josef Stalins favoritbiolog och för att efter att han blivit chef för den sovjetiska vetenskapsakademiens institut för genetik bekämpat klassisk genetik till förmån för sin egen Lysenkoism. Vetenskapliga motståndare förlorade sina jobb och en del deporterades. (Ändå lyckades Dimitrij Belyaev under 50-talet starta domesticeringsexperimentet med rävar på en pälsfarm i Sibirien.)

Lysenkoismen innefattade bland annat ärftliga förvärvade egenskaper — alltså att ärftliga förändringar inte skulle uppstå som genetiska mutationer, oberoende av miljön, utan som svar på förändringar i individens miljö. Var nu gränsen mellan biologi och politik går är inte gott att veta, men evolution genom riktade förändringar som förvärvas under individens livstid var i alla fall ingenting som Lysenko & co var först med eller ensamma om.

Idéer om sådana riktade ärtfliga förändringar brukar kallas Lamarckism, efter Jean-Baptiste Lamarck som levde och verkade under kring sekelskiftet till 1800-talet. (Det är ganska taskigt mot Lamarck att koppla ihop honom med Lysenko, men Lysenko betraktade i alla fall själv Lamarck som en förebild.) Hur som helst, i och med att epigenetiken kommit på tapeten och även en del samtida biologer börjar tänka sig att det skulle kunna finnas sådant arv (vid sidan av det genetiska, den här gången, inte istället för det), har Lysenkos givit upphov till någon sorts biologins motsvarighet till Godwin’s lag. När epigenetik diskuteras kan han leta sig in på ett hörn, så nu har vi stämt i bäcken genom att nämna honom direkt.

Lysenkoismen omfattade i alla fall minst ett faktiskt epigenetisk fenomen. Det kallas vernalisering, och betyder att en del växter kommer blomma snabbare på våren om de utsätts för kyla under vintern. Det är alltså ett av de tillfällen där en epigenetisk signal reagerar på miljön — men, det är fråga om en ärftlighet mellan celler, inte från växt till frö. Vernalisering är alltså en av de de (vanliga) epigenetiska förändringar som stannar inom samma individ och inte gå arv till nästa generation — därför gör den ingen nytta vid växtförädligen.

Efterhand har olika biologer börjat reda ut vilka proteiner och epigenetiska markeringar som ligger bakom vernalisering. Bäst känd är den förmodligen i den bäst kända laboratorieväxten. Säg hej till backtrav (Arabidopsis thaliana):

(Bild från Wikipedia, publicerad av Marko Roepers och Creative Commons-licensierad.)

Den här lilla figuren är alltså en av växtbiologins stjärnor. Och det är nu vi ska komma till den coola tillämpningen av RT-PCR. Försöket beskrivs i en artikel av Heo & Sung, Vernalization-Mediated Epigenetic Silencing by a Long Intronic Noncoding RNA.

Kort molekylär sammanfattning av hur vernalisering aktiveras: Proteinet VIN3 är det som reagerar på kylan. Det kopplar sedan ihop sig med ett proteinkomplex som kallas PRC2 (polycomb repressive complex 2). Polycomb är en grupp av proteiner som ändrar på kromatinets struktur, alltså hur DNA är ihoprullat, och på så sätt kontrollerar genuttryck.

Som tidigare nämnda PRDM9 arbetar det genom att sätta dit metylgrupper på histonerna. PRC2 metylerar histonerna kring genen FLC. FLC står för flowering locus, och har alltså med blomning att göra. Närmare bestämt motverkar den blomning. När histonerna kring FLC metyleras minskar genuttrycket — dess hämmande effekt på blomning motverkas. Växten blommar fortare. Katten på råttan, råttan på repet, VIN3 på PRC2 på FLC. Men det fattas ändå minst ett steg.

PRC2, det histonmetylerande komplexet, kan metylera histoner både här och där, och det är inte klart vad det är som får det att verka just kring FLC. Hur kan ett komplex av proteiner hitta till en viss DNA-sekvens? En del proteiner känner ju igen vissa DNA-sekvenser och binder till kromosomen där just de sekvenserna förekommer; PRDM9 var ett exempel på det med sitt CCTCCCTNNCCAC-motiv. Polycombkomplex, däremot, har visat sig binda till vissa sekvenser i RNA. Om det finns ett RNA som bär på den sekvensen och i sin tur passa på något visst ställe i genomet — då kan Polycombkomplexet binda till RNA:t, som i sin tur binder till kromosomen, och då kan komplexet metylera histoner just på det stället. Ett sådant RNA kan ligga i en icke-kodande del (intron) av genen ifråga kallas long intronic noncoding RNA. Eftersom molekylärbiologer älskar förkortningar kallas det också lincRNA.

Inspirerade av ett par tidigare exempel på sådana RNA-molekyler i samband med Polycombkomplex, letade Heo & Sung efter långa RNA-molekyler som passade FLC-genen. Hur leta efter RNA-molekyler? Med RT-PCR, naturligtvis. De skaffade sig dryga hundra primerpar för att kopiera upp olika icke-kodande delar runt omkring FLC; isolerade RNA och tillverkade cDNA från köldbehandlade växter; och körde sina PCR-reaktioner.

cDNA:t motsvarar alltså de delar av genomet som transkriberas till RNA. När vi vidtagit mått och steg (en bra RNA-isoleringsmetod och behandling med ett DNA-nedbrytande enzym) ska RNA-provet vara hyfsat rent. Omvänd transkription med slumpvisa primers ger oss  cDNA från alla möjliga RNA-molekyler. Om vi sedan får en PCR-produkt från en region kan vi alltså anta att den skrivs av till en RNA-kopia.

Heo & Sung lyckades sedan isolera den RNA-molekyl som PCR-produkterna kom ifrån, ett lincRNA som ligger i FLC:s första intron, alltså i ett icke-kodande gap inne i själva genen. De gav RNA-molekylen namnet COLDAIR. Det ligger också nära en reglerande sekvens (VRE, vernalization response element) som krävs för att vernaliseringen ska fungera. De använde transgena växter med reducerat COLDAIR-uttryck, som åtminstone delvis förlorade förmågan till vernalisering. COLDAIR ska alltså in någonstans i kedjereaktionen vi beskrev ovan. Men det verkar ännu inte klart… Hur aktiveras COLDAIR? Har det kanske med något protein som binder till VRE-sekvensen att göra?

Dessutom är det här faktiskt inte det första ncRNA:t i FLC-trakten. Swiezewski & co hittade flera långa RNA-molekyler som uttrycks från andra änden av genen! (De använde inte RT-PCR utan en DNA-chipmetod.) Deras senaste arbete publicerades förrförra året; deras RNA heter inte COLDAIR utan COOLAIR.

Det får inte vara för enkelt.

Litteratur

Heo JB, Sung S. (2011) Vernalization-Mediated Epigenetic Silencing by a Long Intronic Noncoding RNA. Science 331 ss. 76-79.

Swiezewski S, Liu F, Magusin A, Dean C. (2010) Cold-induced silencing by long antisense transcripts of an Arabidopsis Polycomb target. Nature 462 ss. 799-802.

Amasino R. (2004) Vernalization, Competence, and the Epigenetic Memory of Winter. The Plant Cell 16 ss. 2553-2559.

Caspari EW, Marshak RE. (1965) The Rise and Fall of Lysenko. Science ss. 275-278.

Vernalization-Mediated Epigenetic Silencing by a Long Intronic Noncoding RNA

Konsten att känna igen trams, del 2: Det här är inte ett okej sätt att rita ett diagram

Det är oerhört tråkigt att skriva om fusk, förfalskningar och trams; det var meningen att den här bloggen skulle handla om cool biologi. Men, så kom det några diagram. Vad de påstås visa är att incidensen av vanliga vaccinerbara barnsjukdomar sjönk innan vaccinerna infördes. Några bloggare som inte gillar vaccinationer har tagit upp dem i samband med Wakefield-affären. (Kanske för att trösta sig?) Här är diagrammet för mässling. Tyvärr är det konstruerat på ett mycket osnyggt sätt.

(Ritat av Raymond Obomsawin och cirkulerar på nätet under titeln ”Proof That Vaccines Didn’t Save Us”)

Rättare sagt, jag såg det här diagrammet i mars i förra året på medicinbloggen Respectful Insolence. Och jag tänkte ungefär som Orac — kurvan är alldeles för slät och fin! Trots att den täcker åren 1935-1983 ändras lutningen bara tre gånger! Det ser ut att vara en mätpunkt vart tolfte år med linjer emellan. Det finns väl ingen bra anledning att anta att antalet mässlingsfall mellan 1959 och 1971 följer ett linjärt samband? Och borde det inte finnas data från varje år, inte vart tolfte?

Följer vi länken längst ner i diagrammet kommer vi till till Public Health Agency of Canadas hemsida, och där finns ett mer komplett diagram:

Jag förstår som sagt inte riktigt grejen med att rita in linjer mellan punkterna i en tidsserie. Men ändå, det här diagrammet är betydligt taggigare. Som vi kan vänta oss går antalet mässlingsfall upp och ner från år till år (närmare bestämt i cykler med en ökning vart annat till vart tredje år) — antalet fall är absolut inte strängt minskande, som det första diagrammet.

Vi ser också att under tio år, 1959-1968, var inte mässling en rapporteringspliktig sjukdom i Canada. Därför finns inga punkter där. Det var också då, 1963-1964 som mässlingsvacciner infördes.

Här är linjerna rätt missvisande; det ser ju ut som att mässlingsfallen störtdök precis 1959… Vilket bara beror på att det saknas ett värde för 1959 — och vart ska linjen mellan punkterna dras då om inte ner mot noll…? Gammalt visdomsord: om du ska till att ersätta saknade data med nollor, tänk efter en gång till, för resultatet är ren fiktion. (Tack och lov finns det en artikel med ett bättre diagram där det här framgår tydligt.)

I det första diagrammet har Obomsawin hoppat över det faktum att tio år, alltså större delen av ett av hans tolvårshopp, helt fattas; och valt ut årtal som ger intrycket av ett snyggt, slätt, strängt minskande samband. Vi kan fråga oss, om man nu ändå ska hitta på fritt, vad är det för vits med att ge en länk till den riktiga källan?

Litteratur

King A, Varughese P, De Serres G, Tipples GA, Waters J, Working Group on Measles Elimination. (2004) Measles elimination in Canada. Journal of Infectious Diseases 189