Den sura genetikern

Häromveckan skrev jag något kritiskt om vetenskap i medier. Det gör jag inte så ofta längre.

Det var en post om genetisk variation i MAOA-genen som kopplats till antisocialt beteende (med mera med mera) och dokumentären ”Ditt förutbestämda liv” som SVT sände ganska nyligen. Den går inte att se på SVT Play längre, men det finns en trailer i alla fall.

En gång i tiden så brukade jag läsa DN:s och SR:s vetenskapssidor och om jag hittade något intressant slå upp originalartiklarna, leta reda på pressmeddelanden, artiklar i engelskspråkiga tidningar som stått som förebild och så vidare. Ibland skrev jag kritiska brev och ibland postade jag länkar till originalartiklar, så de plockades upp av någon aggregator och länkades från nyhetsartikeln. Det var oskyldigare webbtider när nyhetstidningar var villiga att länka ogranskade bloggposter från sina artiklar. Men jag har nästan slutat med det, och när jag skriver något kritiskt gör det mig alltid lite nervös. Det är av flera anledningar:

1. Är det så viktigt att det är rätt?

Jag har förstås skaffat mig en massa onödigt bestämda åsikter om genetik, evolution och hur man bör uttrycka sig om dem. Det vore onödigt att tjafsa om alla dessa småsaker. Men jag tycker ändå att det är rimligt att kritisera beskrivningar av forskning som säger saker som inte är sanning, till exempel att ett par kandidatgenstudier från 2002-2003 är banbrytande och skriver om hela genetiken, eller att genetisk variation i MAOA är viktig för att förstå antisocialt beteende, när bevisen för det är i högsta grad skakiga. Dokumentären påstod till och med att Caspi et al 2003 (den om depression och serotonintransportgenen 5HTT) skulle vara en av världens mest refererade artiklar.

2. Tänk om jag har fel?

Det har jag ju ändå rätt ofta. Det finns en hel litteratur om MAOA, något tjog primärstudier eller så. De är, som jag skrev, en blandad kompott av positiva och negativa resultat (Foley & al 2004, Huang & al 2004, Haberstick & al 2005, Huizinga & al 2006, Kim-Cohen & al 2006, Nilsson & al 2006, Widom, Spatz & Brzustowicz 2006, Young & al 2006, Frazzetto & al 2007, Rief & al 2007, van der Vegt & al 2009, Weder & al 2009, Beach & al 2010, Derringer & al 2010, Edwards & al 2010, Enoch & al 2010). Det tyder på att effekten är för liten eller för variabel i förhållande till stickprovsstorleken. Knäckfrågan i det här fallet, som behövs för att kunna utvärdera både originalstudien och uppföljarna är: Om det nu skulle finnas en interaktion mellan varianter av MAOA och en dålig uppväxt, hur stor skulle den vara då? Tyvärr är det inte så lätt att veta.

Om vi skulle försöka oss på att rita en styrkekurva för interaktionen mellan MAOA och dålig uppväxt (Caspi & al 2002), det vill säga hur stor sannolikhet en studie av den här storleken har att hitta en effekt, så måste vi gissa vad en realistisk effekt skulle kunna vara. Artikeln gör en rad jämförelser, men om vi ska välja en så tycker jag det är rimligt att ta skillnaden mellan de som har riskvarianter och som inte blivit illa behandlade och de som har den och har blivit gravt illa behandlade under uppväxten. Om riskvarianter av MAOA verkligen gör människor mer sårbara för att bli illa behandlade under barndomen, så borde den här jämförelsen visa det. Vi behöver också välja en av variablerna att koncentrera oss på. Varför inte uppförandestörning (conduct disorder), vilket måste vara den som nämns i dokumentären.

Om vi simulerar data med olika oddskvoter (x-axeln; OR står för ”odds ratio”) och ritar en styrkekurva blir resultatet ungefär så här. (Obs, jag har läst av siffrorna från ett av diagrammen i artikeln. De är nog bara ungefär rätt.) Det vill säga, om vi antar samma andel ”gravt illa behandlade” individer och samma stickprovsstorlek, så ökar sannolikheten att hitta ett statistiskt signifikant resultat ungefär så här:

maoa_power

Det vill säga, den är inte särskilt stor. Vilka effektstorlekar kan vara rimliga? I samma artikel skattar de oddskvoten kopplad till att bli illa behandlad (hos de utan riskvarianten, och de är betydligt fler) till 2.5 för gravt illa behandlade och 1.3 för ”sannolikt” illa behandlade. Ficks & Waldman (2013) gjorde en metaanalys av studier med MAOA och antisocialt beteende (utan att ta hänsyn till interaktioner) och fick en oddskvot på 1.2. Rautiainen et al (2016) har gjort en helgenomsanalys av aggression hos vuxna och den största effekt de hittar är ungefär 2.2.

Men problemet med låg styrka är inte bara att det är svårt att få ett statistiskt signifikant resultat om det finns en stor och riktig skillnad. För om man, mot alla odds, hittar ett statistiskt signifikant resultat, hur stor ser effekten ut att vara? Den ser, med nödvändighet, ut att vara jättestor. Det här diagrammet visar den skattade effekten i simuleringar där resultatet var statistiskt signifikant (på 5%-nivån):

maoa_exaggeration

Men visst, det är förstås möjligt att de ursprungliga studierna hade tur med sina handfullar människor, att de som misslyckades med att detektera någon interaktion hade otur, och att MAOA-varianter kommer visa sig ha stora reproducerbara effekter när det efter hand börjar komma helgenomstudier som inkluderar interaktioner med miljövariabler. Jag håller inte andan.

(Koden bakom diagrammen finns på github. Förutom osäkerheten om vilken jämförelse som är den mest relevanta, så beror styrkan hos logistisk regression också på den konstanta termen, oddsen för beteendeproblem hos de som saknar riskvarianten. De är något fler än de som har den, men det är ändå en skattning med stor osäkerhet. Här har jag bara stoppat in den skattning jag fått ur data utläst ur diagrammet i Caspi & co 2002.)

3. Vill jag verkligen ha rollen som den professionella gnällspiken?

”Det finns en i varje familj. Två i min faktiskt.” Och det finns minst en på varje vetenskaplig konferens, i varje hörn av den vetenskapliga litteraturen, och på vetenskapsbloggar här och där … Alltså, någon som gjort det till sin uppgift att protestera, gärna med hög röst och blommigt språk, varje gång någon inte gör någon viss vetenskaplig idé rättvisa. Det finns förstås ett värde i kritik, och ingen har någon plikt att komma med ett bättre alternativ när de framför välgrundad kritik. Men det är ändå inte den skojigaste rollen, och det är inte riktigt vad jag vill viga mitt liv åt.

Så, varför inte skriva om något med arv och miljö som jag gillar? Här är en artikel jag såg publiceras ganska nyligen om förhållandet mellan arv, miljö och risk — i det här fallet handlar det om hjärtsjukdom.

Khera, Amit V., et al. ”Genetic Risk, Adherence to a Healthy Lifestyle, and Coronary Disease.” New England Journal of Medicine (2016).

Den här studien vinner, ur mitt perspektiv, på att den inte bara koncentrerar sig på en enda gen, utan kombinerar information från varianter av ett gäng (femtio) gener där varianter tidigare kopplats till risk för hjärtsjukdom. När det gäller komplexa egenskaper som påverkas av många genetiska varianter är det här en mycket bättre idé. Det är antagligen till och med en nödvändighet för att dra några meningsfulla slutsatser om genetisk risk. De kombinerar också ett antal miljövariabler som antas påverka risken för hjärtsjukdom, det vill säga mer eller mindre hälsosamma vanor.

(Artikeln är tillgänglig gratis men inte licensierad under någon rimlig licens, så jag visar inte det diagram från artikeln jag skulle vilja visa här. Klicka på länken och titta på ”Figure 3” om du vill se det.)

Själva sensmoralen i ”Ditt förutbestämda liv” var att gener i och för sig spelar roll, men att en bra uppväxt är bra för alla. Det kan i och för sig gömma sig gen–miljöinteraktioner under de additiva effekter som den här studien bygger på, men sensmoralen blir ändå densamma: ett hälsosamt leverne verkar vara bra för alla, även de som haft otur med sina genetiska varianter och fått hög genetisk risk.

4. Det känns orättvist mot de som försökt kommunicera vetenskap, och kanske kontraproduktivt.

Tack och lov behöver jag sällan skriva om saker som är särskilt långt ifrån det jag är utbildad inom. Vetenskapsjournalister och -reportrar gör det desto oftare, och dessutom på begränsad tid. Oftast gäller det dessutom forskning som är alldeles ny, och därför extra svår att utvärdera. Men i det här fallet gäller det faktiskt forskning som är över tio år gammal, och både de som gjorde dokumentären och Vetenskapens värld som valde dess inramning i SVT misslyckades helt, tycker jag, med att sätta den i perspektiv. Jag vet inte om det är författarna själva eller dokumentärmakarna som är orsak till att vinkeln var enastående genombrott som inte behöver ifrågasättas eller nyanseras. Kanske är det orättvist att kräva av Vetenskapens värld-redaktionen att de ska anlägga ett annat perspektiv än dokumentären de valt att sända. Eftersom att jag gärna vill vill att reportrar och journalister ska skriva entusiastiskt om genetisk forskning (inklusive helst min egen), så tvekar jag lite att skriva ner dem med arga brev. Förhoppningsvis tar de inte allt för illa upp.

Litteratur

Ficks, Courtney A., and Irwin D. Waldman. ”Candidate genes for aggression and antisocial behavior: a meta-analysis of association studies of the 5HTTLPR and MAOA-uVNTR.” Behavior genetics 44.5 (2014): 427-444.

Rautiainen, M. R., et al. ”Genome-wide association study of antisocial personality disorder.” Translational Psychiatry 6.9 (2016): e883.

Khera, Amit V., et al. ”Genetic Risk, Adherence to a Healthy Lifestyle, and Coronary Disease.” New England Journal of Medicine (2016).

(Samt en massa kandidatgenstudier om MAOA som jag länkar ovan.)

Den ökända krigargenen möter Vetenskapens värld

SVT:s Vetenskapens värld sände nyligen (17 oktober, ”Ditt förutbestämda liv”) ett program om beteendegenetik. Det handlar om en studie i Dunedin, Nya Zeeland, som kopplar varianter av vissa gener, i kombination med påfrestande händelser under livets gång, till antisocialt beteende, depression med mera. SVT och dokumentären presenterar den som ”en oerhörd studie” som ”skrivit om den klassiska frågan om arv och miljö och visat att kombinationen är det avgörande”. Men det är snarare en stilstudie i hur välmenande forskare kan ha otur, dra förhastade slutsatser och skapa ett nystan av överdrifter. Otur och otur, förresten, för dem själva ledde det ju till berömmelse och dokumentärer som når ända till Sverige. Men för vetenskapen om den genetiska grunden för beteende var det ändå mest otur.

På 00-talet, när studierna ifråga publicerades, var beteendegenetiker väldigt optimistiska om vad som krävdes för att hitta gener som förklarar komplexa egenskaper, till exempel våldsamt beteende, depression med mera. Många trodde att det räckte att göra som i Dunedin, samla in data från kanske 1000 individer och välja ut en gen, en så kallad ”kandidatgen”, att studera. Komplexa egenskaper, som mänskligt beteende, kan visst ha en avsevärd ärftlig komponent. Men den består av hundratals, kanske tusentals, okända genetiska varianter med små effekter. Dagens genetik har gått vidare till att studera tiotusentals eller hundratusentals individer för att ha en chans att hitta några varianter, och till att studera alla gener samtidigt istället för att försöka gissa vilka kandidatgener som är viktiga.

Men tusen människor, hör jag er protestera, det är väl ändå många? I fallet MAOA tittar de bara på män, så där ryker hälften. Sedan är det ungefär en tredjedel av dem som har riskvarianten, och en bråkdel av dem som haft en dålig uppväxt. I dokumentären låter kopplingen mellan MAOA, dålig uppväxt och antisocialt beteende så övertygande. Richie Poulton, en av författarna, säger: ”Om man tittar på de killar som har riskvarianten av genen och som blev gravt illa behandlade, så uppvisade hela 85% av dem någon form av antisocialt beteende när de blivit vuxna [min översättning].” I själva verket, om man läser artikeln, så består gruppen han talar om – män med riskvarianten som blivit gravt illa behandlade under uppväxten – av 13 individer. De 85% han talar om är alltså elva män. Hur många av dem hade, enligt originalartikeln dömts för något våldsbrott vid 26 års ålder? Svaret är fyra. Med ett stickprov på 13 människor får man inga bra mått på vad riskvarianten har för effekt. Man får brus.

Och brus är precis vad som kommer ur kandidatgenstudier inom psykiatrisk genetik. Det går till ungefär så här: Någon hittar en kandidatgen i en liten studie, dåförtiden med stor buller och bång. Sedan kommer dussintals liknande studier med motsägelsefulla resultat. Ibland hittar de något liknande, ibland inte. Ibland hittar de en effekt på något annat: en interaktion med något nytt, en annan vagt relaterad egenskap. Efter hand börjar folk göra meta-analyser, som lägger ihop resultaten från många studier. De visar på stor variation och små effekter. Och så går det vidare. När det till slut börjar komma studier med större urval, som tittar på hela arvsmassan, så syns det (med några lysande undantag som apolipoprotein E) oftast inte ett spår av kandidatgenerna.

Men visst, ingen har tittat efter varianter i hela genomet med just de gen–miljöinteraktioner som var i Dunedinstudien. Och associationsstudier av hela genomet har hittills bara hittat varianter som kan förklara en bråkdel av den genetiska variationen. Så de gamla kandidatgensfavoriterna kanske också gömmer sig där ute, även om det inte ser ut så. Oavsett är det klart att de inte kan vara mer än en bråkdel av förklaringen, och att metoden att gissa kandidatgener och testa dem i små stickprov inte fungerar något vidare. Men på teve och i pressmeddelanden finns det aldrig komplikationer eller negativa resultat. Därför är MAOA också känd som ”the warrior gene”. Den är ett perfekt provokativt exempel att ta upp när man vill säga att människor är stenhårt programmerade av evolutionen att bete sig på ett visst sätt. Eller, som i den här dokumentären, när man vill komma ett mer humanistiskt budskap om hur uppväxten kan övervinna generna.

Författarna och dokumentärmakarna har såklart rätt i att både arv och miljö spelar roll för komplexa egenskaper. De har kanske till och med rätt att gen–miljöinteraktioner, där effekten av en viss genetisk variant bara visar sig under speciella miljöförhållanden, är viktiga. Men de har fel i att varianter i MAOA spelar en avgörande roll. Om MAOA-varianten har någon effekt alls, vilket inte ens är säkert, så är den bara en variant med liten effekt bland hundratals andra. Resultat som MAOA-associationen i Dunedin är inte några genombrott som skakar beteendegenetiken i grunden. De är ärliga misstag från en ung vetenskap som för 15 år sedan ännu inte hade lärt sig hur svårt det är att hitta gener som förklarar komplexa egenskaper. Istället för att älta dem är det dags att lämna kandidatgenerna bakom sig och gå vidare.

(Det här inlägget är lite försenat, för jag försökte få en kortare version av den här texten publicerad. Jag vet inte vad jag tänkte där. SVT Vetenskap har inte heller svarat. Den som läste den blev väl stött, eller avskrev den ungefär som en arg insändare. Nåja. Efter själva programmet var det ett par svenska forskare som fick vara med och prata lite. De var nog bra på sina ämnen, men ingen av dem verkade veta särskilt mycket om genetik, och sa inget kritiskt om själva innehållet. Ingen kritiserade heller det orimliga skrytet som dokumentären var full av. Jag förstår att jag framstår som en surgubbe nu, men det kan inte hjälpas.)

Litteratur

Caspi et al. (2002) ”Role of genotype in the cycle of violence in maltreated children.” Science

Caspi et al. (2003) ”Influence of life stress on depression: moderation by a polymorphism in the 5-HTT gene.” Science.

På dna-dagen: Genetik utan dna

Så här på dna-dagen tänkte jag skriva lite om vad som går att göra utan att veta något om dna, och varför det (förstås) blir ännu bättre med dna.

Vi tänker oss tillbaka till tiden före genomprojekt, sekvenseringsmaskiner och kloning. Säg någon gång i 1900-talets början. Vad vet vi om ärftlighet? Vi vet att egenskaper går i arv. Det behöver man inte vara något ljushuvud för att lägga märke till. Vi vet att djuravel och växtförädling fungerar. Det vill säga, om man väljer ut de individer som har egenskaper vi behöver och låter dem para sig, så kommer nästa generation bli ännu bättre. Det är 1700-talskunskap allra minst, och förmodligen mycket äldre än så. Vi har en teori om ärftlighet, från Mendel och hans berömda ärtor  Vi vet att ärftligheten består av anlag som blandas om varje generation, men utan att spädas ut. Det är de som idag kallas genetiska varianter.

Varje individ har en uppsättning genetiska varianter. De påverkar individens egenskaper, och de går vidare till nästa generation när individen får barn. Modernt uttryckt: Alla individer har gener, och de finns i olika genetiska varianter. Alla har två varianter av varje gen, och en av dem kommer gå vidare till varje avkomma. Vi vet ännu inte vad generna består av (spoiler: det är dna).

En del egenskaper är enkla, och verkar styras av varianter av en enda gen. En höna kan ha vita fjädrar eller färgade, till exempel; det styrs av varianter av en enda gen. Den ena varianten gör hönan vita fjädrar, och den andra tillåter andra färger att komma fram. Egenskapen delar in höns i två typer: vita höns och höns med andra färger.

Men de flesta egenskaper är inte så enkla. Ta hur mycket hönan väger. Höns kommer i alla storlekar, små, stora och mittemellan. Det är ofta sådana egenskaper som är viktigast. Hur stor blir hönan? Hur många ägg lägger hon? Hur rädd är hon för människor? Och så vidare. Hur gör vi om vi vill förstå en sådan kvantitativ egenskap?

Vi utgår ifrån det faktum att det finns många gener som påverkar en kvantitativ egenskap. Varje gen finns i flera varianter, och varje individ har två varianter. Vi börjar med att anta något helt orealistiskt, nämligen att vi vet exakt vilka genetiska varianter som finns, och vilka effekter de har. Då kan vi skriva ner en individs egenskap som en summa, där varje term beror på de genetiska varianter individen bär på, plus ett slumpvis bidrag från olika miljöfaktorer. Därifrån kan vi dra slutsatser om medelvärden och variation inom en population av individer och, viktigast av allt, formler för hur nära släktingar liknar varandra.

Då trillar det ut något användbart. De här orealistiska sakerna vi antog i början, att vi kände till varje genetisk variant och vad den gör, visar det sig att vi inte behöver veta. De försvinner ur formlerna. Det är som om vi hade en ekvation med X på båda sidor om likhetstecknet. Då kan vi dividera med X, så den okända variabeln försvinner. Med bara ett släktträd och mätningar av individernas egenskaper går det att räkna fram en massa användbara genetiska värden, utan att behöva veta exakt vilken gen som gör vad. Till exempel kan vi ta reda på vilka individer vi helst borde avla på, eller hur stor del genetiska varianter spelar för en viss egenskap.

Teorin om kvantitativa egenskaper utvecklades i början av 1900-talet. Det är en statistisk teori, som beskriver hur ärftliga egenskaper förs vidare i släktträd och populationer. Den är väl medveten om att det finns gener och genetiska varianter, men klarar sig bra utan att hantera dem direkt.

Ungefär vid samma tid började helt andra forskare reda ut vad arvsanlagen består av. 1953 visste vi inte bara att är dna som är boven i dramat, utan också hur dna-molekylen ser ut. Sedan kom molekylärgenetik, det vill säga genetik som arbetar direkt med dna.

På senare år har kvantitativ genetik och molekylärgenetik mötts på flera sätt. Det har blivit så lätt och billigt (relativt sätt) att göra dna-tester, att många börjat använda dem istället för släktträd. Istället för att mödosamt hålla reda på individers släktskap kan vi titta på deras genetiska varianter direkt, och uppskatta släktträdet från dna.

Det har också blivit möjligt att ta reda på vilka genetiska varianter som påverkar egenskaper, hur mycket de påverkar, och hur de fungerar. Då kan vi får reda på saker som inte syns i släktträd: hur många genetiska varianter som spelar roll för en egenskap, om varianterna är vanliga eller ovanliga, hur stora eller små deras effekter är, och hur de åstadkommer dem. Hur kan små skillnader i dna göra en höna större eller mindre, mer eller mindre rädd för människor, eller få henne att lägga fler eller färre ägg? Men det får vi prata mer om en annan dag.

(Idag var det tydligen dna-dagen, även om den snart är slut. Gamla dna-dagsposter: Gener, orsak och verkan (2015), På dna-dagen (2014))

Undervisning: Molekylärgenetik

NBIC45 utgår! Leve NBIC52! Den senaste varianten av molekylärgenetikkursen har just börjat. Nu var det inte tänkt att jag skulle undervisa något i år, men jag hoppar in som ställföreträdande skägg. Så läraruppställningen ändras lite mindre än det var tänkt från början.

Provrörsställ, rör, lösningar, pipetter och blåsippor som inte har med saken att göra.

Laborationerna, där en kan träffa mig, handlar om nöjsamma saker som genotypning med polymeraskedjereaktionen och att transformera bakterier med plasmider. Och att tolka inte alltid helt tydliga band på geler, samt stå i kö till centrifugen. Jag tycker det är rätt roligt. Att stå i kö till centrifugen är kanske inte det roligaste i världen. Men alla som arbetat i ett molekylärt laboratorium kan intyga att det i alla fall är realistiskt.

Jag har skrivit (och twittrat) något om innehållet i labbarna förut.

På dna-dagen: Gener, orsak och verkan

”DNA, livets molekyl” … Visst, DNA är en viktig och snygg biomolekyl. Men varför skulle inte en komplex kolhydrat, ett protein eller en membranlipid förtjäna det namnet?

Det finns två perspektiv på genetik som jag brukar tjata om. Å ena sidan: genetik som handlar om vad molekylära gener gör och vad de har för funktion. Å andra sidan: genetik som är studiet av ärftliga skillnader mellan individer, och i förlängningen populationer och arter. Genetik beskrivs ibland som en vetenskap som handlar om ”koder” och ”information”. Det ligger något i det, men jag tror det är bra att vara lite försiktig med metaforerna. Jag misstänker att koder och information inte är något vi bara hittar liggande ute i naturen, så att säga, utan mänskliga tolkningar.

Ja, vissa DNA-sekvenser skrivs av till mRNA som kodar för proteiner. Här betyder ”kodar för” att sekvensen har tripletter av baser som är komplementära mot tRNA-molekyler som bär aminosyror. Andra sekvenser motsvarar RNA-molekyler som har någon annan funktion. Men de orsakande faktorerna till att ett visst RNA uttrycks vid en viss tid finns inte i DNA, utan någon annan stans. DNA är en del av mekanismen, men det är också RNA-polymeraset som skriver av det, spliceosomen som sätter ihop aktivt mRNA, de system av enzymer som tillverkar nukleotiderna och så vidare, och så vidare. Processen aktiveras av vad som händer i organismens miljö, interna processer som omfattar många delar av cellen eller helt olika delar av kroppen osv. På så sätt är kärnan med sitt DNA en organell vilken som helst.

Men! Det finns ett sammanhang där det är befogat att prata om genetiska orsaker, nämligen ärftliga skillnader mellan individer. Det går att hitta (och faktiskt konstruera) exempel på individer där dramatiska skillnader i egenskaper som utseende och beteende beror på en skillnad i DNA-sekvens — en genetisk variant eller ”gen” i den klassiska bemärkelsen. Det förstås, det kan finnas andra typer av ärftlighet som inte beror på DNA, och i så fall borde de också räknas med här. Men de flesta saker som inuti celler kan göra skillnad i en organisms egenskaper — proteiner, membranlipider, kolhydrater, små organiska molekyler osv — nollställs mellan generationerna, när könsceller bildas och utvecklingen så att säga börjar om varje generation. Men DNA går i arv — med sin ”information”, om en så vill.

(Den 25 april 1953 publicerades artiklarna som presenterade DNA-molekylens struktur. Därav DNA-dagen. Min DNA-dagspost från förra året: På dna-dagen)

Gruppselektion fungerar, men är det viktigt?

Det här kommer bara vara roligt för dem som redan bryr sig om gruppselektion, men de är förvånansvärt många. Av någon anledning är gruppselektion väldigt provocerande. Ordet ”selektion” är en omskrivning för naturligt urval. Naturligt urval händer när vissa individer i en population har egenskaper som gör dem bättre på att överleva och fortplanta sig än andra. Om egenskaperna ifråga är ärftliga gör det att populationens egenskaper ändras över generationerna. Detta är evolution genom naturligt urval. De genetiska varianter som får individer att klara sig bättre ökar i frekvens. Men tänk om populationen består av grupper av individer som lever särskilt nära varandra. Kan det finnas egenskaper hos en grupp som gör den framgångsrik och som inte kan förklaras av selektion på individer? Ja, det fullt möjligt. Frågan är hur viktigt det är i naturen.

Organismer gör vanligtvis inte saker för populationens, artens eller gruppens skull. De gör saker för sig själva och sin avkomma. Men det finns många situationer där det är lönsamt, alltså förknippat med större reproduktiv framgång, att samarbeta, hjälpa andra och bete sig altruistiskt. Det är ganska tydligt varför det kan vara fördelaktigt för en individ att hjälpa sina ungar. De bär ju på hälften av ens genetiska material! Vi tänker oss en art där ungarna behöver omvårdnad medan de är små. Där kan en genetisk variant som ökar föräldrabeteendet sprida sig, eftersom den ger bäraren fler överlevande ungar, där i medeltal hälften i av dem kommer bära på samma variant. Samma resonemang fungerar för mer avlägsna släktingar, bara i mindre grad, eftersom sannolikheten att vi delar genetiska varianter blir mindre ju längre från varandra i släktträdet vi befinner oss. Detta kallas släktskapsselektion (engelska: kin selection), att förbättra sin reproduktiva förmåga indirekt genom släktingar. Tyvärr är det ett ganska uselt namn, eftersom det är ett namn på en typ av strategier, inte en egen form av selektion. Ett annat namn för samma sak är inclusive fitness, men det är typ omöjligt att översätta till något vettigt.

Det finns en lång lista med möjliga sätt som altruism kan löna sig i längden (se t.ex. West, Griffin & Gardner 2006). Det kan handla om att hjälpa sina släktingar, som ovan, eller att byta tjänster och gentjänster, eller min favorit: grönt skägg-altruism. Det är en situation där vi tänker oss en genetisk variant som har två olika effekter. Å ena sidan får den individen att bete sig altruistiskt mot individer som har ett visst kännetecken, hypotesens ”gröna skägg”. Dessutom får den individen själv att odla ett grönt skägg, alltså uttrycka samma signal. På så sätt kan den sprida sig genom att bärarna känner igen och hjälper varandra.

Så sociala interaktioner och altruism är inga stora mysterier som helt saknar förklaringar. Men att det inte verkar finnas ett skriande teoretiskt behov av gruppselektion betyder inte att effekter på gruppnivå inte finns. Låt oss därför ta ett exempel där selektion på gruppnivå utan tvivel fungerar och påverkar egenskaper. Naturligtvis kommer exemplet från artificiell selektion, inte naturligt urval, och det handlar om höns. En första version av experimentet ifråga beskrivs av William Muir (1996). Höns är inte riktigt anpassade för ett liv i industriell uppfödning. Ett vanligt problematiskt beteende är att hönsen hackar varandra, i värsta fall till döds. Det här experimentet gick ut på att försöka avla dem för att klara sig bättre i gruppburar med flera höns — utan att klippa i deras näbbar, vilket knappast löser problemet för hönsen men hindrar symptomen … Näbbtrimning är förbjudet bland annat i Sverige. Muir avlade höns på överlevnad i gruppburar, där invånarna i en bur valdes eller valdes bort tillsammans som en grupp. I generation 2 var dödligheten 70%. Jag upprepar: på ett år dog 70% av hönsen. I generation 6 var dödligheten 9% procent, vilket är samma dödlighet som kontrolldjur som hölls ensamma.

En stor del av dödligheten förklaras av hur mycket individen blir hackad. Det kan såklart finnas genetiska varianter som skyddar offer mot fjäderhackning, men det viktigaste för individens överlevnad är inte hur mycket den själv hackar utan hur mycket de andra hackar. Det här fenomenet, när en individs egenskaper påverkas av vilka genetiska varianter som finns hos dem hen interagerar med, kan beskrivas med indirekta genetiska effekter. Indirekta genetiska effekter är en mekanism för hur gruppselektion kan fungera. Okej, men vad hade hänt med vanlig avel på individuell nivå? I ett liknande experiment, med höns i gruppburar, tittade författarna (Bijma & co 2007) på direkta och indirekta genetiska effekter på överlevnad. Jag har skrivit om heritabilitet förut, ett mått på hur stor del av variationen i en egenskap som beror på genetisk variation. Den kan skattas med en statistisk modell (se t.ex. Kruuk 2004) där en lägger samman mätningar och släktträd från ett antal individer och uppskattar hur stor del av egenskapen som går i släkten. Bijma & co använde en utökad version av samma modell som också tar hänsyn till effekten av andra gruppmedlemmar och deras släktträd. Det ger dels en vanlig direkt genetisk varianskomponent, den som används till heritabilitet, och en total varians som räknar med påverkan från de andra gruppmedlemmarna. I det här fallet var den totala genetiska variansen för överlevnad ungefär tre gånger så stor som den direkta genetiska variansen. Det intressanta med genetisk varians i avelssammanhang är att den visar hur snabbt en population kommer påverkas av selektion. I den här populationen bör alltså gruppselektion vara betydligt effektivare än individuell selektion i att minska dödligheten. I princip är det möjligt att ha en direkt och indirekt genetisk effekt i motsatt riktning, där selektion på individ och grupp skulle ge motsatta resultat.

Uppdatering 1 februari 2020: Den artikel jag skriver om här, Pruitt & Goodnigh (2014), är del av en skandal. Det verkar som det snällaste någon kan säga om Pruitts forskning just nu är att ”There is no hard evidence that [Pruitt’s] data are fabricated”. Fortsättning följer kanske, men hur som helst ska vi nog inte gå och tro att de där spindlarna ger bevis för några intressanta idéer om lokal anpassning och sociala interaktioner.

Så långt hönshuset. Kan något liknande hända i naturen? Nyligen kom det en artikel (Pruitt & Goodnight 2014) som hävdar att de sett lokal anpassning på gruppnivå hos spindlar av arten Anelosimus studiosus. Spindlarna lever i kolonier där individerna kan klassificeras i två olika beteendetyper: lugna och aggressiva spindlar. Beroende på hur mycket resurser det finns i omgivningarna har naturliga kolonier olika sammansättning. Så författarna samlade in spindlar från olika ställen, födde upp dem i laboratoriet, testade deras beteende och satte ut dem igen i konstruerade kolonier med olika gruppsammansättning. Sedan kom de tillbaka med jämna mellanrum för att se hur bra experimentkolonierna klarade sig. Kort och gott löpte kolonierna större risk att dö ut om deras sammansättning inte matchade sammansättningen hos naturliga kolonier på den platsen. Det verkar som att på vissa platser är det bra att ha många aggressiva spindlar i en koloni, på andra färre, och om en koloni har för många eller för få kommer den klara sig sämre. I rika omgivningar med mycket att äta verkar det fungera bättre att ha många aggressiva individer. I fattigare omgivningar är det bättre med många lugna.

joe_lapp_astud

(A. studiosus av Joe Lapp, på Flickr. cc:by 2.0)

Beteendetyperna, ”lugn” och ”aggressiv” verkar i det här fallet vara till största del bestämda av genetiska varianter. Så frågan är: Vilka interaktioner mellan individer inom kolonin är det som gör att en koloni får en viss sammansättning? Någonting verkar det vara i alla fall, för författarna prövade också att flytta kolonier mellan rik och fattig miljö. Och det ser ut som att kolonier behåller sin karaktäristiska sammansättning över generationerna. Spindlar som kommer från en fattig miljö fortsätter hålla en låg andel aggressiva individer i sina kolonier, även om det vore bättre för dem att ha fler. De verkar vara lokalt anpassade till en resursfattig miljö, där en låg andel aggressiva spindlar hade fungerat bättre.

Oftast det såklart så att de en lever närmast ofta också är de en är närmast släkt med. Så om släktskapsselektion och gruppselektion händer samtidigt kommer det vara svårt eller omöjligt att skilja dem åt. Att jag har svårt att komma på hur en alternativ förklaring med släktsskapsselektion skulle se ut i fallet spindlarna kan bara vara min bristande fantasi. Det är populärt att påstå något i stil med ”gruppselektion och släktskapsselektion är samma sak” av matematiska skäl. Men bevisen för att de bara är beskrivningar av samma process verkar inte vara entydiga. van Veelen m.fl. (2012) ger ett motexempel på en modell där de inte ger samma resultat. Jag kan inte påstå att jag förstår den teoretiska litteraturen på det här området, men att modeller av gruppselektion och av släktskapsselektion är bevisat matematiskt ekvivalenta verkar vara för mycket sagt.

Litteratur

West, S. A., Griffin, A. S., & Gardner, A. (2007). Social semantics: altruism, cooperation, mutualism, strong reciprocity and group selection. Journal of evolutionary biology, 20(2), 415-432.
Bijma, P., Muir, W. M., Ellen, E. D., Wolf, J. B., Van Arendonk, J. A. (2007). Multilevel selection 2: estimating the genetic parameters determining inheritance and response to selection. Genetics, 175(1), 289-299.
Kruuk, L. E. (2004). Estimating genetic parameters in natural populations using the ‘animal model’. Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences, 359(1446), 873-890.
Nature.

Interaktioner mellan gener förklarar antagligen inte den saknade ärftligheten

Har fått flera tips om den här artikeln:

Asko Mäki-Tanila & William Hill (2014)  Influence of Gene Interaction on Complex Trait Variation with Multilocus Models. Genetics.

Den har en hyfsat torr titel och rätt många ekvationer och handlar om något av det intressantaste nämligen kvantitativa egenskaper och gen–gen-interaktioner. Saknad heritabilitet är ett känt genetiskt problem. Det finns flera förslag på lösningar och det är bara att välja sin favorit. Författarnas beräkningar tyder på att den antagligen inte förklaras av interaktioner mellan gener. (Varning: ganska lång och nördig bloggpost. Som vanligt.)

Vad är heritabilitet? Vi tänker oss en egenskap som varierar i en population. Om egenskapen är ärftlig kommer en del av variationen att gå i familjen. Och om vi mäter den och har ett släktträd över individerna kan vi uppskatta hur stor del av variationen som förklaras av släktskap. Detta uttrycks som varianser och kvoten mellan additiv genetisk varians och den totala variansen kallas heritabilitet. (Vadå ”additiv”? Vi kommer tillbaka till det.) Heritabiliteten är ett bråktal mellan noll och ett där ett större värde är en större ärftlig komponent.

Vad är det som saknas? Vi ska inte göra någon katalog, men det finns otaliga olika egenskaper hos växter och djur som är delvis ärftliga. Många har också gjort genetisk kartläggning (en samling tekniker som jag ofta tjatar om, bara delvis för att jag jobbar med dem) för att hitta de gener som förklarar ärftligheten och kunna undersöka hur de fungerar. Problemet är att de gener som går att hitta nästan alltid bara förklarar en liten andel av den ärftliga variationen. För nästan alla egenskaper finns det en avsevärd ”saknad heritabilitet” som måste bero på okända genetiska varianter. Den saknade delen är nästan alltid mycket större än den som förklaras av kända varianter. Exempel: Nyligen publicerades en analys av mänsklig längd baserad på 250 000 individer (Wood & al 2014). Den hittar cirka 700 genetiska varianter som tillsammans förklarar ungefär en femtedel av heritabiliteten.

Okej, så var gömmer den sig? Förmodligen är det är många varianter som bidrar med mycket små enskilda effekter. Då skulle det behövas ännu större studier för att hitta dem. I vissa egenskaper kanske det också är frågan om ovanliga varianter som bara finns i vissa familjer. I så fall skulle de inte hittas i stora populationsstudier utan drunkna i bruset. Men det finns också mer exotiska hypoteser om den saknade heritabiliteten. En är att det skulle vara epigenetisk variation snarare än genetisk (varför jag inte tror det är förklaringen borde jag skriva mer om någon annan gång). En annan är gen–gen-interaktioner, eller på genetiskt fikonspråk epistasi.

Dags att återvända till den additiva genetiska variansen. Det kan nämligen finnas en genetisk komponent som inte direkt går i arv från föräldrar till avkomma. Anlagen går i arv, naturligtvis, men avkommans egenskaper kan bli helt annorlunda om det finns interaktioner mellan olika genetiska varianter. Det blir tydligast med ett exempel med en egenskap som kan delas in i tydliga kategorier och som styrs av varianter på två gener. Det här är ett exempel från världens bästa organism, nämligen hönan.

Titta på bilden. Panel A: en vanlig enkel hönskam. Panel C: pärlkam som orsakas av en genreglerande variant i genen SOX5 (Wright & al 2009). Panel B: rosenkam, som orsakas av omflyttning som påverkar regleringen av genen NMR2 (Imsland & al 2012). Panel D: valnötskam, vilket är vad som händer de som bär båda mutationern. SOX5 och NMR2 är aktiva i samma cellpopulation i förstadiet till kammen under embroynalutvecklingen. Interaktionen mellan varianter som påverkar SOX5 och NMR2 beror förmodligen på att de ingår samma system som bygger upp kammen.

kammar_imsland

(Figur 1 från Imsland & co 2012. cc:by-3.0)

Nu är de flesta intressanta egenskaper inte så enkla och kategoriska som kamtyperna. Principen är ändå densamma. Effekten av en genetisk variant kan bero på vilka andra varianter individen bär på. Detta kallas epistasi.

Det Mäki-Tanilas & Hill tittat närmare på är vad som händer på populationsnivå. De utgår från en hyfsat realistisk situation, det finns ett antal genetiska varianter på olika gener, som alla påverkar samma egenskap. Om varianterna dessutom interagerar med varandra, vad händer med den genetiska variansen? Är den fortfarande huvudsakligen additiv, alltså sådan som går i arv från föräldrar till avkomma, eller blir det en stor icke-additv genetisk varianskomponent istället? På det hela taget så blir det oftast mest additiv genetisk varians, även om det finns interaktioner mellan varianterna.

Varför? Om vi tittar på undantagen: Interaktioner blir märkbara på populationsnivå när det är få varianter som påverkar en egenskap eller när varianterna är vanliga i populationen. Om det är många gener som påverkar egenskapen så späs interaktioneffekterna ut, men epistasi kan ha stor effekt på egenskaper med relativt enkel genetik och få gener. Sådana egenskaper verkar inte vara så vanliga, men de kan finnas. Om en av allelerna (de räknade bara på bara fallet med två alleler per gen) är ovanlig betyder det också att epistasi spelar mindre roll. Om de flesta indiver är genetiskt lika kommer det vara väldigt ovanligt att samma individ bär på flera av varianterna som krävs för att interaktionseffekten ska märkas.

Ta ett helt hypotetiskt exempel: Gen 1 har två varianter stora A och lilla a. Gen 2 ha två varianter stora B och lilla b. Varianten A gör dig i medeltal 1 mm längre. B gör dig också i medeltal 1 mm längre. Men om du råkar ha både A och B får du en extra skjuts på 2 mm, förutom den sammanlagda effekten. Men om populationens genpool nästan helt domineras av a på Gen 1 och b på Gen 2 så kommer individer med både A och B vara väldigt ovanliga. De har ingen större effekt på längdfördelningen i populationen, sådär i allmänhet. Men de gör att enskilda individer med ovanliga genotyper blir ovanligt långa.

Så, författarna hävdar att interaktioner antagligen inte förklarar den saknade heritabiliteten. Tidigare har Zuk m.fl (Zuk & al 2012) föreslagit att en förklaring skulle kunna vara att interaktioner mellan gener stör skattningen av heritabilitet. Mäki-Tanilas & Hills modell tyder på att egenskaper beter sig additivt i alla fall, så det är okej att ignorera interaktioner i heritabilitetsmätningar. Vem som har rätt beror på vilken modell som stämmer bäst med hur komplexa ärftliga egenskaper egentligen fungerar. Jag är böjd att tro att det är den senare modellen, men är inte helt säker.

Det finns en sorts motsättning om epistasi. Å ena sidan verkar egenskaper ha mycket additiv varians. Å andra sidan går det att hitta mängder av interaktioner på molekylär nivå. Gener borde interagera. Om Mäki-Tanila & Hill har rätt så har de förklaringen: det är mycket möjligt att det finns massor av epistasi, men under de vanliga förhållanden är den dominerande varianskomponenten ändå den additiva. Vi som gillar interaktioner kan äta kakan och ha den kvar.

Interaktioner är fortfarande intressanta. För att kunna förutsäga en individs egenskaper från dess genotyper behövs information om hur varianter interagerar med varandra. Det är möjligt att epistasi visar sig vara vanligt i komplexa egenskaper (som en del misstänker). Problemet är att det är så svårt att studera. Att söka efter interagerande par av gener är rutin i vissa typer av kartläggning (som de experimentkorsningar jag sysslar med) men svårare i helgenomsassociation. Jag tror inte det är någon som vet riktigt hur det ska gå till.

”Forskaren är fri”

Politiska ideologier
eländets filosofi
etablissemangets kotterier
men forskaren är fri
dogmatiska religiösa sekter
vetenskapens trolleri
materialismens effekter
men forskaren är fri

Kjell Höglund, Forskaren är fri

En behöver egentligen inte ens veta att Kjell Höglund skrivit böcker med någon sorts esoteriskt innehåll. Det räcker med att lyssna på texten för att förstå att forskaren i det här fallet inte är en akademisk forskare. Men ändå.

 

Dagens rekommendation: Hans Rosling

TED talks är ofta inget vidare men det finns lysande undantag. Hans Roslings tal är några av dem. Ed Yong, som jag rekommenderade häromveckan, ett annat.

Se inte bara den här videon, utan leta runt lite på Youtube.

Några saker att lägga märke till:

Rosling använder inte vilken visualisering som helst; han använder en visualisering som är en polerad variant av ett enkelt diagram med prickar.

Han drar slutsatser från modeller, inte bara grafik. Dels lutar han sig på demografiska modeller, som såvitt jag förstår är mekanistiska modeller över hur populationen av människor kommer växa. Dels extrapolerar han trender i sina diagram. Utan att han säger det skulle jag tro att det skulle motsvara linjära modeller.

Förutom att han uppenbarligen funderat mycket på vilka illustrationer han ska använda, så är han bra på att kalibrera sina jämförelser och ställa dem i relation till begripliga saker. Det är inget som kommer ur siffrorna, utan en fråga om tolkning.

Och, viktig: Rosling tolkar sina modeller som orsakssamband, inte bara som associationer. Han är intresserad av frågor om vad människor borde göra och vad som kommer hända då. Det är inte heller något som går att utläsa ur siffrorna. Det kräver tolkning och antaganden om orsakssamband, men är en oumbärlig del av Roslings argument.

Könsurval: Propellrar, Batemangradient och operationell könskvot

Könsurval är den del av evolution genom naturligt urval som handlar om att hitta en partner att fortplanta sig med. Sexuellt reproducerande organismer kan ha olika anpassningar för att attrahera en partner av motsatt kön eller konkurrera med andra individer av samma kön. De formas av könsurval, men exakt hur de formas beror på organismens livsstil, ekologi och historia. Kokko, Klug & Jennisons (2012) har publicerat en teoretisk modell för att illustrera när anpassningar till könsurval kan uppstå, och i somras hörde jag Hanna Kokko presentera den. Föreställ er en organism, vilken som helst, som ska till att fortplanta sig. Tänk att individerna rör sig på måfå tills de stöter på någon av motsatt kön. De parar sig, får ungar, och är upptagna med det ett tag; de är alltså borta från poolen av tillgängliga individer som kan para sig ett tag innan det är dags igen. Än så länge är detta en (något) förenklad sammanfattning av livet som sexuellt reproducerande organism. Tänk sedan att någon individ utvecklar en ärftlig egenskap som ökar sannolikheten att träffa på en partner. Kokko illustrerade det med en propeller som får dem att färdas omkring fortare. Under vilka förhållanden kommer propellern att främjas av könsurval och spridas i populationen under generationernas gång?

Nu är det frågan om en annan sorts modeller än de modeller jag ibland bloggar om. När jag skriver ”modell” menar jag oftast en statistisk modell som är ett hjälpmedel för att analysera empiriska data. Ett enkelt exempel är om jag mätt någon egenskap hos en population individer och är intresserad av medelvärdet. Då är det rimligt att använda någon sorts statistisk modell för att beskriva variationen inom populationen och få en uppfattning om osäkerheten i min uppskattning av medelvärdet. Men här är det frågan om mekanistiska modeller som gör anspråk på att beskriva någon generell egenskap hos ett fenomen (här: könsurval i en sexuellt reproducerande population), för att sedan dra slutsatser om hur sådana system beter sig. Det är inte en modell av data från en viss population, utan en modell av ett förenklat idealiserat system. I teoretisk biologi använder en ofta matematiska modeller som en sorts logiska argument kring hur biologiska fenomen fungerar.

Operationell könskvot är antalet hanar som är redo att para sig dividerat med antalet honor som är redo att para sig. De som är upptagna med annat och för tillfället inte kan reproducera sig räknas inte. Tanken är att när det är fler som är redo av det ena könet än det andra så blir det konkurrens emellan dem där fler är redo. Beroende på olika arters livsstil kan det vara fler eller färre honor och hanar som är redo att para sig vid en given tid. Det kanske till exempel tar väldigt lång tid att föda upp en kull ungar innan en har tid att skaffa och ta hand om en ny. På så sätt borde den operationella könskvoten påverka utrymmet för könsurval. Om det, till exempel, finns många hanar och få honor finns det stort utrymme för hanarna att utveckla olika anpassningar för att stå sig bra i konkurrensen. Om den operationella könskvoten är ungefär lika finns det ingen större konkurrens om partners och ingen vidare nytta med att lägga energi på det.

Nu till en gammal favorit: Batemangradienten! Vad den mäter är hur mycket det lönar sig att para sig med ännu en partner. Det vill säga: hur många fler ungar får en individ per extra partner. Batemans klassiska hypotes är att gradienten ska vara nära noll för honor, vilket betyder att de begränsas av resurserna de investerar i avkomman, och positiv för hanar, som investerar mindre i avkomman. Men det beror naturligtvis på hur organismen ifråga lever och hur dess könsroller ser ut.

De två ovanstående begreppen används ofta för att beskriva olika arters sociala system kring fortplantning. Men de mäter olika saker: den operationella könskvoten visar hur svårt eller lätt det är att hitta en partner till; Batemangradienten mäter hur mycket det skulle höja ens reproduktiva framgång. Sammantaget: det är mer lönsamt med anpassningar till könsurval om det finns en positiv Batemangradient (så att fler parningar betyder fler överlevande ungar) och en sned operationell könskvot (så att en faktiskt måste anstränga sig för att få para sig flera gånger), men räcker inte att titta på bara det ena eller det andra. Se Hanna Kokko själv prata bland annat om detta på ESEB2013 förra sommaren. Ja, videon är bitvis inget vidare men presentationsbilderna är mestadels läsbara och talarens röst är klar och tydlig! Jag gillar särskilt bilden med vattenglaset, som sammanfattar det tillstånd som ofta råder i biologi. Optimisten tycker att naturen är spännande med all sin komplexitet och pessimisten att den är en enda svårtolkad röra.

Litteratur

Kokko, H., Klug, H., & Jennions, M. D. (2012). Unifying cornerstones of sexual selection: operational sex ratio, Bateman gradient and the scope for competitive investment. Ecology letters, 15(11), 1340-1351.

Jag påmindes om presentationen när jag såg en bloggpost om ämnet av Lilly Herridge.