ADHD och kopietal: postskriptum

Det är en sak till jag tycker vi borde ta upp om kopplingen mellan ADHD och kopietalsvariationer. Det är en fråga som olika människor nosat på i kommentarer kring gårdagens nyhetsartiklar.

Det börjar med en viktig invändning: Att två saker korrelerar betyder inte att den ena orsakar den andra. Det är en bra sak att påminna sig om då och då, och en bra mycket bra fråga att ställa när någon fysiologisk process kopplas till beteende. Så varför inte ställa den om generna också: Varför tolkar både vi och forskarna de här resultaten som att genetiska variationer är en del av orsaken till ADHD — istället för att tänka sig att ADHD kanske orsakar genförändringar?

Ett svar kan vara att genetiska mutationer, för allt vi vet, brukar inträffa slumpvis. Ju längre vi lever, desto fler blir mutationerna, och celler här och där får olika förändringar i sin arvsmassa. En del börjar bete sig lite konstigt, men de flesta dör och ersätts efterhand. Kroppen har mycket god koll på att celler kopierar sitt DNA ordentligt och bara delar sig när de ska.

Därför är det extremt osannolikt att de genetiska variationer som krävs för att orsaka ökad risk för en fenotyp som ADHD skulle uppstå i en hel människas kropp. Det enda säkra sättet att få en viss genetisk variation i någon större del av kroppen är att ärva den. De varianter som pekades ut i ADHD-artikeln har med allra största sannolikhet uppstått vid den speciella celldelning som kallas meios, som ger upphov till könscellerna. En mutation som uppstår där kan gå i arv till nästa generation, finnas i hela barnets kropp och sedan gå i arv till barnbarnen.

(Det finns ett otäckt undantag till den här regeln — en genuint genetisk sjukdom som oftast inte går i arv, utan uppstår spontant under livets gång — och det är cancer. Men cancercellerna fuskar; de mutationer de drabbats av gör att de börjar växa med en brutal kraft, undkommer kroppens reglerande system och växer ifrån sina grannceller, som inte delar sig så mycket. Men det är en annan historia.)

Det här betyder alltså inte att olika miljöfaktorer inte kan vara inblandade i ADHD; sådana finns alldeles säkert. Men vi kan vara rätt säkra på att ADHD inte orsakar själva de genetiska varianterna. De kommer sig nog istället av att vissa människor av ren slump råkat ut för mutationer i gener som på något sätt har med beteende att göra.

Referensen de glömde: ADHD och kopietal

Som vi lite surt konstaterade tidigare är det rätt sällan vetenskapsjournalister bemödar sig med att tala om vilken artikel det är de refererar, vilket gör det svårt att kolla upp kontroversiella påståenden.

Här är ett par tidningsartiklar om ett sådant ämne, nämligen ADHD. De har fått karaktäristiska provocerande rubriker. Kommentarsfältet är i uppror och ett tjugotal bloggare ekar tidningens slutsatser med hoppfulla eller upprörda utrop. Det kan finnas anledning att ta en titt själv.

Men först måste vi hitta artikeln. Det är inte det lättaste. Men journalisten har givit oss lite hjälp genom att skriva ut en av forskarnas namn — Anita Thapar och tidskriften, The Lancet. Tack!

En sökning i PubMed ger vid handen att ”Thapar A” publicerat tre artiklar om ADHD i år, samt ett par om depression och födselvikt. En av dem skulle kunna vara artikeln, en helgenomsstudie. Men den är publicerad i Journal of the American Academy of Child and Adolescent Psychiatry, inte The Lancet, och är inte riktigt så ny. Och här är det såklart lite feltänkt av mig; en artikel som publicerats idag har nog inte hunnit snappas upp av PubMed eller Google Scholar.

Så, om vi tittar på The Lancets hemsida och söker på ”Thapar”, så finner vi istället den förhandspublicerade artikeln: Rare chromosomal deletions and duplications in attention-deficit hyperactivity disorder: a genome-wide analysis.

Bingo! För att bilda oss en bättre uppfattning kan vi läsa artikelns sammanfattning. Den är tillgänglig även för folk utan prenumeration.

Men en sak till: de provocerande rubrikerna: ”Forskare: adhd har genetiska orsaker” — ”ADHD kan bero på ‘trasiga’ gener”. Även om det är sant, så måste vi komma ihåg följande: Det betyder inte att ADHD endast har genetiska orsaker; det kan vi inte vara säkra på. Det betyder inte heller att ADHD inte skulle gå att behandla; det följer inte heller av en genetisk komponent. Det betyder heller inte motsatsen, alltså att den genetiska grunden med nödvändighet leder till en ny effektiv behandling; tyvärr hjälper det ofta inte särskilt mycket. (Somliga kommentarer och bloggare verkar föreställa sig en direkt koppling mellan genetiska upptäckter och tillverkning av nya mediciner. Någon sådan finns inte.)

Det betyder heller inte att människor med ADHD på något sätt är defekta; vissa gener och proteiner saknas eller beter sig annorlunda i jämförelse med folk i allmänhet — och kan på så sätt med visst fog kallas trasiga varianter. Hur ändrar det vår bild av människor med ADHD att det finns en genetisk komponent? Svaret på den frågan borde vara inte alls. Om den genetiska komponenten spelar tillräckligt stor roll kan det såklart påverka hur vi ser på varför människor har ADHD.

Att det kan finnas en viss genetisk komponent borde heller inte vara någon nyhet. Författarna hade knappast påbörjat arbetet om det inte fanns anledning att tro på en genetisk komponent — det hade varit slöseri med tid och pengar. I bakgrunden finns forskning som redan tyder på att ADHD är ärftligt, annan forskning som kopplar CNV:er (Copy Number Variations; på svenska kanske kopietalsvariationer — det är den typ av genetiska varianter som de sökt efter, helt enkelt bitar av en kromosom som förekommer olika många gånger) till autism och schizofreni och — till och med — ett annat arbete som publicerades i somras som kopplar CNV:er till ADHD.

Låt oss alltså ta det lite lugnt.

Länkningskartläggning, kromosomer som korsas och The Gay Gene

Finns det en gen för homosexualitet? Svaret på den frågan, förstådd i strikt bemärkelse, är såklart nej. Det kan inte vara en enda gen som entydigt bestämmer ett komplicerat beteende som sexuell läggning. Därmed kunde den här texten vara slut, om det vore ett enkelt svar vi var ute efter.

Men det är intressantare att fråga sig ifall det medges komplicerade och kulturellt influerade beteende vi kallar sexuell läggning har någon genetisk komponent — och hur dessa gener i så fall fungerar. (På A svarar vi ”ja, förmodligen” och på B ”vet inte”.) Vi ska inte ge oss på att försöka besvara de frågorna här, utan istället ägna oss åt den mest kända kandidaten till en sådan gen och vad som hände med den. Jag har nämnt den tidigare, som exempel på en kandidatregion som inte gått att bekräfta. Eftersom den också, ironiskt nog, kanske är det mest  kända exempelet på genetisk kartläggning av mänskligt beteende förtjänar den att beskrivas mer i detalj. Läs mer

Något om flerfaldiga jämförelser och att prata känslor med en död lax

Som Gunnar påpekade borde vi behandla flerfaldiga statistiska jämförelser — i all enkelhet, som statistiska amatörer. Låt oss titta på Manhattandiagrammet från förra posten igen:

(Eriksson et al. 2010)

På x-axeln kommer alltså SNP:arna i den ordning de förekommer i genomet, kromosom för kromosom. Y-axeln skrev jag visade p-värde, men det är inte riktigt sant. Skalan är logaritmisk och den visar egentligen den negativa tiologaritmen av p-värdet, alltså hur många gånger man måste dela ett med tio för att få p-värdet i fråga.

Gränsen där punkterna börjar bli röda, och SNP:arna betraktas som signifikant associerade med egenskapen (i det här fallet fräknar) infaller ungefär när -log10(p-värde) är 8 (närmare bestämt 8,4). Det innebär ett mycket litet p-värde, närmare bestämt .

Det är hög tid att fundera på vad det här p-värdet är. Inom statistisk hypotesprövning (vilket är ett sätt att resonera statistiskt; det finns andra) ställer vi alltid en hypotes (den vi vill pröva) mot en nollhypotes (en sorts utgångsläge, som vi ofta inte ens tror på). Om vi vill jämföra två grupper med avseende på någon egenskap brukar nollhypotesen vara att det inte finns någon skillnad mellan gruppernas medelvärden; den hypotes vi vill pröva är såklart att det finns en skillnad som är skild från noll.

Sedan samlar vi in data, ett så kallat stickprov, och uppskattar medelvärdet (eller vilken parameter vi nu vill testa) och variationen i stickprovet. Baserat på variationen i stickprovet uppskattar vi hur stor sannolikheten är att det här resultatet, eller ett ännu bättre (alltså ett som talar starkare för vår hypotes), uppstår av en slump. Den sannolikheten är p-värdet. Om den sannolikheten är liten är vi rätt säkra på att resultatet inte uppsått av en slump, utan beror på en riktig skillnad. Då tror vi mer på vår hypotes än på nollhypotesen; vi säger att vi förkastar nollhypotesen.

p-värdet avspeglar alltså inte sannolikheten att vi har rätt, utan risken för att göra en viss typ av fel, alltså risken att förkasta nollhypotesen fast den är sann. Den här typen av resonemang har sina sidor. Ett problem är hur negativa resultat ska tolkas. Ifall vi inte får en signifikant skillnad, och alltså inte förkastar nollhypotesen, betyder det att nollhypotesen är sann? Inte nödvändigtvis. Det finns ofta inget bra sätt att visa en avsaknad av en skillnad.

I fallet genetisk association är nollhypotesen såklart att varje enskild SNP inte är associerad till egenskapen; den hypotes vi prövar är att det det finns en association. Var vi ska dra gränsen för ett signifikant resultat är en samvetsfråga. Hur stor risk att göra fel kan vi acceptera? En vanlig, och helt godtycklig, gräns är 1 på 20. Då förkastar vi nollhypotesen om p < 0.05.

Åter till Manhattandiagrammet. Där var gränsen alltså . Det är väldigt väldigt väldigt (väldigt, väldigt, väldigt…) mycket mindre än 0.05. Varför?

Jo, i studien ifråga tittade de på dryga 500 000 olika SNPs och 22 olika egenskaper. Det innebär att de sammanlagt prövade hypotesen om association mer än elva miljoner gånger. Med den vanliga gränsen vid 1 på 20 skulle de i så fall riskera att, totalt i hela studien, ha fel cirka 550 000 gånger (om vi antar att jämförelserna är oberoende; det är de förmodligen inte, så fullt så illa behöver det inte vara), av ren slump.

Det vore naturligtvis inte acceptabelt, och därför har de i artikeln ifråga justerat sitt tröskelvärde och gjort det mångfaldigt lägre. De har räknat som om testerna är oberoende, och då fått fram  som så kallad simultan signifikansnivå, det vill säga den signifikanströskel de måste hålla för att hela studien, tagen tillsammans, ska ha p < 0.05. (Det här sättet att kontrollera den simultana signifikansnivån kallas Bonferroni-justering.)

Låt oss ta ett exempel som illustrerar vad som kan hända om vi inte håller koll på den simultana signifikansen. Det är inte bara vid helgenomsassociation som det blir massvis av statistiska tester. Funktionell magnetresonans, fMRI, är ett sätt att ta bilder av hjärnan i arbete och ta reda på vilken del av hjärnan människor eller djur använder för att göra olika saker. (Exakt vad ”hjärnan i arbete” betyder i det här fallet är inte helt självklart, men nu ska det bara handla om statistiken, inte om den biologiska grunden för fMRI.)

fMRI ger upphov till en tredimensionell bild, med tusentals punkter som motsvarar volymelement — så kallade voxlar (jämför med pixlarna på den tvådimensionella datorskärmen). Craig Bennet och hans kollegor la en död lax i en fMRI-scanner, visade foton av människor i olika stiuationer och gav den i uppgift att bedöma vilka känslor människorna på bilden upplevde. Som syns i metoderna gjorde de en rad komplicerade beräkningar, men det hela leder fram till ett statistiskt test som de utför med olika tröskelvärden för p-värdet.

Titta gärna på själva postern och den snygga bilden av det lilla röda området i laxens huvud. Ett test på nivå p < 0.001, vilket kan tyckas rätt lågt, ger ändå en liten grupp voxlar mitt i den döda laxens hjärna, där det verkar pågå någon sorts verksamhet. När de däremot använde två metoder (inte Bonferroni, utan mer sofitikerade varianter) för att hålla koll på den simultana signifikansen, så försvinner det. Sensmoralen är: håll koll på den simultana signifikansen.

Litteratur

Allan Gut, (2007) Konsten att räkna: tankar om siffror och statistik, Norstedts, är en bok om statisik som introducerar hypotesprövning på ett behagligt sätt.

Signifikans vid flerfaldiga tester brukar presenteras i samband med variansanalys i läroböcker.

Craig M Bennet et al. (2009) Neural correlates of interspecies perspective taking in the post-mortem Atlantic Salmon: An argument for multiple comparisons correction.

En gen för fräknar, en gen för lockar, en gen för lukten av sparris

Det finns en rad företag som erbjuder genetiska analyser till privatpersoner. För några tusen får du spotta i ett rör, och företaget typar ett antal genetiska markörer, alltså kända platser i genomet som varierar mellan människor. Den informationen, alltså vilka varianter en individ bär på, kan ge lite olika upplysningar. Men det är inte så många genetiska varianter där vi faktiskt vet hur de ska tolkas.

En del information är mest för nöjes skull — saker vi förmodligen redan har märkt eller som vi inte har någon direkt nytta av. De flesta vet vilken ögonfärg de har även utan gentest, till exempel.

Några har kliniskt värde i och med att de speglar variationer i leverns enzymsystem och indikerar förmågan att bryta ner olika läkemedel. CYP2D6, till exempel, är en mycket känd sådan, som då och då typas i vården. Farmakogenetik, kallas den genetik som handlar om variationer i vårt svar på läkemedel, och det är kanske den form av personlig genetik som har störst potential att leverera inom överskådlig tid. Gentester till konsumenter i all ära, men än så länge är de mest en form av dyra leksaker.

Några, slutligen, avspeglar risk för olika sjukdomar. Här är det viktigt att veta, att de flesta sjukdomarna ifråga har en komplex genetisk bakgrund som interagerar med miljöfaktorer. Alltså, det vi hittar är inte en gen som orsakar sjukdomen, utan ett antal genetiska markörer som har ett samband med sjukdomsrisk. (En genetisk markör är en känd variation någonstans i genomet som går att typa; att en markör har ett samband med sjukdomsrisk betyder sannolikt att den ligger i närheten någon variation som orsakar den ökade risken.)

Det mest kända företaget i gentestningbranschen, 23andMe, har varit på tapeten ett par gånger den sista tiden. Den första anledningen var inte så smickrande. Nyligen visade det sig att 23andMe givit felaktiga uppgifter till ett antal kunder för att någon satt ner en platta med prover åt fel håll i en maskin…

Den andra anledningen är desto roligare: nyligen publicerade forskare från 23andMe sin första granskade vetenskapliga artikel: Web-Based, Participant-Driven Studies Yield Novel Genetic Associations for Common Traits publicerades den 24 juni, knappt ett år efter att den skickades in i PLoS Genetics. PLoS, Public Library of Science, publicerar en serie tidskrifter vars innehåll är Creative Commons-licensierat, och alltså kan läsas och spridas vidare av vem som helst (till skillnad från de flesta vetenskapliga tidskrifter, som bara är tillgängliga från universitetsbibliotek och andra instutitioner som betalar multum för prenumerationer).

Det är en artikel som handlar om den första typen av egenskaper ovan: ett antal egenskaper som inte är så medicinskt intressanta, men desto vanligare. Det finns definitivt ett vetenskapligt intresse i att beskriva hur genetiska variationer bidrar till den normala mänskliga variationen i till exempel utseende.

Arbetet är också särskilt intressant på grund av hur datainsamligen gått till. Försökspersonerna är nämligen de av 23andMes kunder som gått med på att att delta med sina data i vetenskapliga försök. De har själva samlat in proverna, genom att skicka sin saliv i ett rör med posten, och information om fenotyper, genom att besvara enkätfrågor på 23andMes hemsida, där de också hämtar sina data. 23andMe har alltså lyckats få försökspersoner att betala för privilegiet att delta i studien!

Den typ genetisk markör som 23andMe jobbar med kallas single nucleotide polymorphism (SNP). Det är ställen där, en enda position i genomet, en bas, skiljer sig mellan individer. Ett A, adenosin, kan till exempel vara utbytt mot cytosin, C. SNP:ar har den goda egenskapen att det finns massor av dem, så det går att typa markörer relativt tätt utspridda över hela genomet och på så sätt beskriva en individs genom i detalj. Genom att kombinera många individers genotypdata med information om dem, går det att statistiskt koppla samman genotyp med fenotyp — alltså att undersöka vilka genetiska varianter som hänger ihop med en viss egenskap. Detta kallas genome wide association (GWAS), kanske på svenska kanske helgenomsassociation. Det är vad 23andMe har gjort.

De har frågat sina kunder vilken hårfärg och ögonfärg de har, ifall de är fräkniga, är morgonmänniskor, har visdomständer, är vänster- eller högerhänta, har glasögon, har tandställning, gillar sötsaker, blir åksjuka och så vidare. Sedan har de formulerat resultaten som 22 antingen-eller: fräknar ja/nej, ögonfärg brun/blå, hårfärg blond/brun, rött hår ja/nej, och så vidare. 22 gånger har de alltså delat upp deltagarna i två grupper: en fall-grupp (”case”) där deltagarna har egenskapen i fråga, och en kontrollgrupp som inte har den. Och så jämförde de, för varje SNP, vilken variant folk har i fallgruppen och vilka de har i kontrollgruppen.

För åtta fenotyper hittade de SNP:ar som statistiskt skiljer sig mellan grupperna, och alltså är associerade med egenskapen — rött hår, fräknar, blont eller brunt hår, bruna eller blå ögon, gröna eller blå ögon, lockigt hår, samt två små konstigheter: tendensen att nysa i vid starkt ljus och förmågan att känna lukten av sparrismetaboliter i urin.

Här ser vi ett så kallat Manhattandiagram för fräknar. Varje punkt är en SNP, och på y-axeln finns p-värdet, som är ett statistiskt mått på hur stor tilltro vi sätter till associationern. Röda punkter är signifikant associerade SNP:ar, alltså de som har p-värden högre än ett visst tröskelvärde.

(Bild från artikeln; Eriksson et al. 2010)

Vi lägger märke till att de röda SNP:arna kommer i grupper som bildar små torn i diagrammet. Det är SNP:ar som ligger nära varandra och alltså alla är associerade med egenskapen och den eventuella närliggande underliggande varianten. De associerade SNP:arna leder sedan fram till kandidatgener, alltså troliga misstänkta gener i närheten av markören. Observera uttrycken ”kandidat” och ”misstänkta”… Det är inte alls självklart att genetiska kartläggningar träffar rätt. Kandidatgenerna behöver studeras närmare för att ta reda på vilka varianter det finns i dem, vad de faktiskt gör och hur det går till. Det är förstås också bra ifall resultatet kan upprepas i andra studier. (”The Gay Gene”, en kandidatregion för homosexualitet, är ett känt exempel på en association som inte gått att upprepa — ryktet om den verkar dock ändå inte vilja ta slut.)

Diagrammet ovan gäller fräknar, och här syns tre röda berg — tre regioner där det finns kandidatgener. Två av dem är upprepningar av tidigare associationer och den tredje är ny — det är en SNP som ligger inuti genen BNC2, som därmed är en ny kandidatgen för fräknar. Den liknar BNC1, en bättre känd gen vars proteinprodukt är viktig för hudceller. Det finns alltså en viss logik i att den kunde ha med fräknar att göra. Men som sagt, det återstår att se.

Litteratur

Eriksson N, Macpherson JM, Tung JY, Hon LS, Naughton B, et al. (2010) Web-Based, Participant-Driven Studies Yield Novel Genetic Associations for Common Traits. PLoS Genet 6 e1000993. doi:10.1371/journal.pgen.1000993

Genetisk prägling, eller Varför det inte går att fixa barn av två äggceller utan att först göra en genetiskt modifierad klon av en av föräldrarna

Prägling är ett ord som jag tror jag lärde mig av Bamsetidningen. Vid en klättertur i ett berg hittar Bamse, Lille Skutt och Skalman ett ägg som kläcks till en gigantisk ödla som präglas på Bamse, vartefter den glatt travar efter honom. Prägling är alltså en form av inlärning där vissa djur lär sig känna igen vilka som är deras föräldrar — och för den delen vilka som är lämpliga att para sig med. Och den kan alltså ibland riktas åt konstiga håll, till exempel mot människor eller döda ting. (Om dinosaurier hade prägling ska jag låta vara osagt.)

Genetisk prägling betyder något lite liknande, nämligen att vissa gener har förmågan att känna igen sina föräldrar, i den betydelsen att det finns någonting som får dem att fungera olika beroende på vilken av föräldrarna de kom ifrån.

Alltså: Vi diploida organismer bär på (med undantag för de som råkat få tre av någon kromosom) två kopior av vårt genom, alltså vår uppsättning kromosomer. (Diploid betyder alltså två kopior. Könscellerna är haploida och har bara en kopia. Polyploidi, många kopior, är vanligt bland växter.) Den ena kopian kommer från mamma och den andra från pappa. I de flesta fall spelar det ingen roll vilken kopia som kommer från vem, utan det viktiga är vilken sekvens genen har.

Men i några fall — kanske inte så några; idag är typ 80 genetiskt präglade gener kända — är ursprungsföräldern helt avgörande. Kopian som kommer från den ena föräldern kommer nämligen inte uttryckas, alltså användas, alls. Vad genen ifråga anbelangar är människan alltså närmast haploid. Vilken av kopiorna som kommer användas och vilken som stängs av beror på genen; i fallet Igf2 är det kopian från pappa som används, och i fallet Igf2r används kopian från mamma, till exempel.

Den här konstigheten förekommer hos människor och möss (de två djur där den studerats mest), andra däggdjur och bland växter. Varför det förmodligen inte finns hos djur som lägger ägg kan vi kanske återkomma till. Först måste vi nog ursäkta den dramatiska rubriken. Vad har det här med barn av två äggceller att göra?

Jo, kunskapen om genetisk prägling stammar delvis från upptäckten att möss som fått båda kopiorna av vissa delar av sina kromosomer från samma förälder inte utvecklas som de ska. När det gäller vissa kritiska gener måste vi ha både en mamma och en pappa. Två kopior från mamma eller två från pappa duger inte. Varför det är så framgår av ovan: om en gen bara uttrycks från kopian som kommer från mamma och båda kopiorna i ett embryo kommer från pappan — då innebär det i praktiken att uttryck av den genen helt saknas — och vad gäller gener som bara uttrycks från pappan, så kommer de överuttryckas istället. (Det kanske kan vara okej för vissa mindre avgörande gener, men tyvärr visar sig flera präglade gener vara viktiga för själva fosterutveckligen.) Det kan förklara varför partenogenes (jungfrufödsel — alltså att en ny individ utvecklas ur ett obefruktat ägg) inte finns bland däggdjur. Avkomman skulle ju då få båda sina kopior av genomet från mamma.

Nu till rubriken! Detta ger oss ett svar på en fråga som dyker upp förvånande ofta: går det inte att skaffa ett barn från två äggceller (eller två spermier), alltså ett barn som även genetiskt har två föräldrar av samma kön? Numera finns det möss som har två mammor och ingen pappa. Hur gick det till? Jo, det behövs såklart något sätt att se till att de där kritiska generna uttrycks i rätt mängd. Tjuvknepet i det här fallet är att den ena musen är transgen — den saknar en gen som kallas H19, ligger strax bredvid Igf2 och är på något ännu okänt sätt inblandad i regleringen av hur Igf2 och några närliggande gener uttrycks. Den förändringen räcker tydligen för att några av musungarna skulle kunna födas och bli vuxna. Om de i övrigt är helt friska förtäljer inte historien (och det är de förmodligen inte).

Det är alltså knappast ett tänkbart sätt att skaffa barn. Men det tyder på att bristen på jungfrufödslar hos däggdjur faktiskt kan förklaras av genetisk prägling, för om bara uttrycket några präglade gener rättas till så fungerar det — åtminstone hjälpligt.

Litteratur

Kono T, Obata Y, Wu Q, Niwa K, Ono Y, Yamamoto Y, Park ES, Seo J-S, Ogawa H. (2004) Birth of parthenogenetic mice that can develop to adulthood. Nature 428 ss. 860–864