Något om flerfaldiga jämförelser och att prata känslor med en död lax

Som Gunnar påpekade borde vi behandla flerfaldiga statistiska jämförelser — i all enkelhet, som statistiska amatörer. Låt oss titta på Manhattandiagrammet från förra posten igen:

(Eriksson et al. 2010)

På x-axeln kommer alltså SNP:arna i den ordning de förekommer i genomet, kromosom för kromosom. Y-axeln skrev jag visade p-värde, men det är inte riktigt sant. Skalan är logaritmisk och den visar egentligen den negativa tiologaritmen av p-värdet, alltså hur många gånger man måste dela ett med tio för att få p-värdet i fråga.

Gränsen där punkterna börjar bli röda, och SNP:arna betraktas som signifikant associerade med egenskapen (i det här fallet fräknar) infaller ungefär när -log10(p-värde) är 8 (närmare bestämt 8,4). Det innebär ett mycket litet p-värde, närmare bestämt .

Det är hög tid att fundera på vad det här p-värdet är. Inom statistisk hypotesprövning (vilket är ett sätt att resonera statistiskt; det finns andra) ställer vi alltid en hypotes (den vi vill pröva) mot en nollhypotes (en sorts utgångsläge, som vi ofta inte ens tror på). Om vi vill jämföra två grupper med avseende på någon egenskap brukar nollhypotesen vara att det inte finns någon skillnad mellan gruppernas medelvärden; den hypotes vi vill pröva är såklart att det finns en skillnad som är skild från noll.

Sedan samlar vi in data, ett så kallat stickprov, och uppskattar medelvärdet (eller vilken parameter vi nu vill testa) och variationen i stickprovet. Baserat på variationen i stickprovet uppskattar vi hur stor sannolikheten är att det här resultatet, eller ett ännu bättre (alltså ett som talar starkare för vår hypotes), uppstår av en slump. Den sannolikheten är p-värdet. Om den sannolikheten är liten är vi rätt säkra på att resultatet inte uppsått av en slump, utan beror på en riktig skillnad. Då tror vi mer på vår hypotes än på nollhypotesen; vi säger att vi förkastar nollhypotesen.

p-värdet avspeglar alltså inte sannolikheten att vi har rätt, utan risken för att göra en viss typ av fel, alltså risken att förkasta nollhypotesen fast den är sann. Den här typen av resonemang har sina sidor. Ett problem är hur negativa resultat ska tolkas. Ifall vi inte får en signifikant skillnad, och alltså inte förkastar nollhypotesen, betyder det att nollhypotesen är sann? Inte nödvändigtvis. Det finns ofta inget bra sätt att visa en avsaknad av en skillnad.

I fallet genetisk association är nollhypotesen såklart att varje enskild SNP inte är associerad till egenskapen; den hypotes vi prövar är att det det finns en association. Var vi ska dra gränsen för ett signifikant resultat är en samvetsfråga. Hur stor risk att göra fel kan vi acceptera? En vanlig, och helt godtycklig, gräns är 1 på 20. Då förkastar vi nollhypotesen om p < 0.05.

Åter till Manhattandiagrammet. Där var gränsen alltså . Det är väldigt väldigt väldigt (väldigt, väldigt, väldigt…) mycket mindre än 0.05. Varför?

Jo, i studien ifråga tittade de på dryga 500 000 olika SNPs och 22 olika egenskaper. Det innebär att de sammanlagt prövade hypotesen om association mer än elva miljoner gånger. Med den vanliga gränsen vid 1 på 20 skulle de i så fall riskera att, totalt i hela studien, ha fel cirka 550 000 gånger (om vi antar att jämförelserna är oberoende; det är de förmodligen inte, så fullt så illa behöver det inte vara), av ren slump.

Det vore naturligtvis inte acceptabelt, och därför har de i artikeln ifråga justerat sitt tröskelvärde och gjort det mångfaldigt lägre. De har räknat som om testerna är oberoende, och då fått fram  som så kallad simultan signifikansnivå, det vill säga den signifikanströskel de måste hålla för att hela studien, tagen tillsammans, ska ha p < 0.05. (Det här sättet att kontrollera den simultana signifikansnivån kallas Bonferroni-justering.)

Låt oss ta ett exempel som illustrerar vad som kan hända om vi inte håller koll på den simultana signifikansen. Det är inte bara vid helgenomsassociation som det blir massvis av statistiska tester. Funktionell magnetresonans, fMRI, är ett sätt att ta bilder av hjärnan i arbete och ta reda på vilken del av hjärnan människor eller djur använder för att göra olika saker. (Exakt vad ”hjärnan i arbete” betyder i det här fallet är inte helt självklart, men nu ska det bara handla om statistiken, inte om den biologiska grunden för fMRI.)

fMRI ger upphov till en tredimensionell bild, med tusentals punkter som motsvarar volymelement — så kallade voxlar (jämför med pixlarna på den tvådimensionella datorskärmen). Craig Bennet och hans kollegor la en död lax i en fMRI-scanner, visade foton av människor i olika stiuationer och gav den i uppgift att bedöma vilka känslor människorna på bilden upplevde. Som syns i metoderna gjorde de en rad komplicerade beräkningar, men det hela leder fram till ett statistiskt test som de utför med olika tröskelvärden för p-värdet.

Titta gärna på själva postern och den snygga bilden av det lilla röda området i laxens huvud. Ett test på nivå p < 0.001, vilket kan tyckas rätt lågt, ger ändå en liten grupp voxlar mitt i den döda laxens hjärna, där det verkar pågå någon sorts verksamhet. När de däremot använde två metoder (inte Bonferroni, utan mer sofitikerade varianter) för att hålla koll på den simultana signifikansen, så försvinner det. Sensmoralen är: håll koll på den simultana signifikansen.

Litteratur

Allan Gut, (2007) Konsten att räkna: tankar om siffror och statistik, Norstedts, är en bok om statisik som introducerar hypotesprövning på ett behagligt sätt.

Signifikans vid flerfaldiga tester brukar presenteras i samband med variansanalys i läroböcker.

Craig M Bennet et al. (2009) Neural correlates of interspecies perspective taking in the post-mortem Atlantic Salmon: An argument for multiple comparisons correction.

En gen för fräknar, en gen för lockar, en gen för lukten av sparris

Det finns en rad företag som erbjuder genetiska analyser till privatpersoner. För några tusen får du spotta i ett rör, och företaget typar ett antal genetiska markörer, alltså kända platser i genomet som varierar mellan människor. Den informationen, alltså vilka varianter en individ bär på, kan ge lite olika upplysningar. Men det är inte så många genetiska varianter där vi faktiskt vet hur de ska tolkas.

En del information är mest för nöjes skull — saker vi förmodligen redan har märkt eller som vi inte har någon direkt nytta av. De flesta vet vilken ögonfärg de har även utan gentest, till exempel.

Några har kliniskt värde i och med att de speglar variationer i leverns enzymsystem och indikerar förmågan att bryta ner olika läkemedel. CYP2D6, till exempel, är en mycket känd sådan, som då och då typas i vården. Farmakogenetik, kallas den genetik som handlar om variationer i vårt svar på läkemedel, och det är kanske den form av personlig genetik som har störst potential att leverera inom överskådlig tid. Gentester till konsumenter i all ära, men än så länge är de mest en form av dyra leksaker.

Några, slutligen, avspeglar risk för olika sjukdomar. Här är det viktigt att veta, att de flesta sjukdomarna ifråga har en komplex genetisk bakgrund som interagerar med miljöfaktorer. Alltså, det vi hittar är inte en gen som orsakar sjukdomen, utan ett antal genetiska markörer som har ett samband med sjukdomsrisk. (En genetisk markör är en känd variation någonstans i genomet som går att typa; att en markör har ett samband med sjukdomsrisk betyder sannolikt att den ligger i närheten någon variation som orsakar den ökade risken.)

Det mest kända företaget i gentestningbranschen, 23andMe, har varit på tapeten ett par gånger den sista tiden. Den första anledningen var inte så smickrande. Nyligen visade det sig att 23andMe givit felaktiga uppgifter till ett antal kunder för att någon satt ner en platta med prover åt fel håll i en maskin…

Den andra anledningen är desto roligare: nyligen publicerade forskare från 23andMe sin första granskade vetenskapliga artikel: Web-Based, Participant-Driven Studies Yield Novel Genetic Associations for Common Traits publicerades den 24 juni, knappt ett år efter att den skickades in i PLoS Genetics. PLoS, Public Library of Science, publicerar en serie tidskrifter vars innehåll är Creative Commons-licensierat, och alltså kan läsas och spridas vidare av vem som helst (till skillnad från de flesta vetenskapliga tidskrifter, som bara är tillgängliga från universitetsbibliotek och andra instutitioner som betalar multum för prenumerationer).

Det är en artikel som handlar om den första typen av egenskaper ovan: ett antal egenskaper som inte är så medicinskt intressanta, men desto vanligare. Det finns definitivt ett vetenskapligt intresse i att beskriva hur genetiska variationer bidrar till den normala mänskliga variationen i till exempel utseende.

Arbetet är också särskilt intressant på grund av hur datainsamligen gått till. Försökspersonerna är nämligen de av 23andMes kunder som gått med på att att delta med sina data i vetenskapliga försök. De har själva samlat in proverna, genom att skicka sin saliv i ett rör med posten, och information om fenotyper, genom att besvara enkätfrågor på 23andMes hemsida, där de också hämtar sina data. 23andMe har alltså lyckats få försökspersoner att betala för privilegiet att delta i studien!

Den typ genetisk markör som 23andMe jobbar med kallas single nucleotide polymorphism (SNP). Det är ställen där, en enda position i genomet, en bas, skiljer sig mellan individer. Ett A, adenosin, kan till exempel vara utbytt mot cytosin, C. SNP:ar har den goda egenskapen att det finns massor av dem, så det går att typa markörer relativt tätt utspridda över hela genomet och på så sätt beskriva en individs genom i detalj. Genom att kombinera många individers genotypdata med information om dem, går det att statistiskt koppla samman genotyp med fenotyp — alltså att undersöka vilka genetiska varianter som hänger ihop med en viss egenskap. Detta kallas genome wide association (GWAS), kanske på svenska kanske helgenomsassociation. Det är vad 23andMe har gjort.

De har frågat sina kunder vilken hårfärg och ögonfärg de har, ifall de är fräkniga, är morgonmänniskor, har visdomständer, är vänster- eller högerhänta, har glasögon, har tandställning, gillar sötsaker, blir åksjuka och så vidare. Sedan har de formulerat resultaten som 22 antingen-eller: fräknar ja/nej, ögonfärg brun/blå, hårfärg blond/brun, rött hår ja/nej, och så vidare. 22 gånger har de alltså delat upp deltagarna i två grupper: en fall-grupp (”case”) där deltagarna har egenskapen i fråga, och en kontrollgrupp som inte har den. Och så jämförde de, för varje SNP, vilken variant folk har i fallgruppen och vilka de har i kontrollgruppen.

För åtta fenotyper hittade de SNP:ar som statistiskt skiljer sig mellan grupperna, och alltså är associerade med egenskapen — rött hår, fräknar, blont eller brunt hår, bruna eller blå ögon, gröna eller blå ögon, lockigt hår, samt två små konstigheter: tendensen att nysa i vid starkt ljus och förmågan att känna lukten av sparrismetaboliter i urin.

Här ser vi ett så kallat Manhattandiagram för fräknar. Varje punkt är en SNP, och på y-axeln finns p-värdet, som är ett statistiskt mått på hur stor tilltro vi sätter till associationern. Röda punkter är signifikant associerade SNP:ar, alltså de som har p-värden högre än ett visst tröskelvärde.

(Bild från artikeln; Eriksson et al. 2010)

Vi lägger märke till att de röda SNP:arna kommer i grupper som bildar små torn i diagrammet. Det är SNP:ar som ligger nära varandra och alltså alla är associerade med egenskapen och den eventuella närliggande underliggande varianten. De associerade SNP:arna leder sedan fram till kandidatgener, alltså troliga misstänkta gener i närheten av markören. Observera uttrycken ”kandidat” och ”misstänkta”… Det är inte alls självklart att genetiska kartläggningar träffar rätt. Kandidatgenerna behöver studeras närmare för att ta reda på vilka varianter det finns i dem, vad de faktiskt gör och hur det går till. Det är förstås också bra ifall resultatet kan upprepas i andra studier. (”The Gay Gene”, en kandidatregion för homosexualitet, är ett känt exempel på en association som inte gått att upprepa — ryktet om den verkar dock ändå inte vilja ta slut.)

Diagrammet ovan gäller fräknar, och här syns tre röda berg — tre regioner där det finns kandidatgener. Två av dem är upprepningar av tidigare associationer och den tredje är ny — det är en SNP som ligger inuti genen BNC2, som därmed är en ny kandidatgen för fräknar. Den liknar BNC1, en bättre känd gen vars proteinprodukt är viktig för hudceller. Det finns alltså en viss logik i att den kunde ha med fräknar att göra. Men som sagt, det återstår att se.

Litteratur

Eriksson N, Macpherson JM, Tung JY, Hon LS, Naughton B, et al. (2010) Web-Based, Participant-Driven Studies Yield Novel Genetic Associations for Common Traits. PLoS Genet 6 e1000993. doi:10.1371/journal.pgen.1000993

Genetisk prägling, eller Varför det inte går att fixa barn av två äggceller utan att först göra en genetiskt modifierad klon av en av föräldrarna

Prägling är ett ord som jag tror jag lärde mig av Bamsetidningen. Vid en klättertur i ett berg hittar Bamse, Lille Skutt och Skalman ett ägg som kläcks till en gigantisk ödla som präglas på Bamse, vartefter den glatt travar efter honom. Prägling är alltså en form av inlärning där vissa djur lär sig känna igen vilka som är deras föräldrar — och för den delen vilka som är lämpliga att para sig med. Och den kan alltså ibland riktas åt konstiga håll, till exempel mot människor eller döda ting. (Om dinosaurier hade prägling ska jag låta vara osagt.)

Genetisk prägling betyder något lite liknande, nämligen att vissa gener har förmågan att känna igen sina föräldrar, i den betydelsen att det finns någonting som får dem att fungera olika beroende på vilken av föräldrarna de kom ifrån.

Alltså: Vi diploida organismer bär på (med undantag för de som råkat få tre av någon kromosom) två kopior av vårt genom, alltså vår uppsättning kromosomer. (Diploid betyder alltså två kopior. Könscellerna är haploida och har bara en kopia. Polyploidi, många kopior, är vanligt bland växter.) Den ena kopian kommer från mamma och den andra från pappa. I de flesta fall spelar det ingen roll vilken kopia som kommer från vem, utan det viktiga är vilken sekvens genen har.

Men i några fall — kanske inte så några; idag är typ 80 genetiskt präglade gener kända — är ursprungsföräldern helt avgörande. Kopian som kommer från den ena föräldern kommer nämligen inte uttryckas, alltså användas, alls. Vad genen ifråga anbelangar är människan alltså närmast haploid. Vilken av kopiorna som kommer användas och vilken som stängs av beror på genen; i fallet Igf2 är det kopian från pappa som används, och i fallet Igf2r används kopian från mamma, till exempel.

Den här konstigheten förekommer hos människor och möss (de två djur där den studerats mest), andra däggdjur och bland växter. Varför det förmodligen inte finns hos djur som lägger ägg kan vi kanske återkomma till. Först måste vi nog ursäkta den dramatiska rubriken. Vad har det här med barn av två äggceller att göra?

Jo, kunskapen om genetisk prägling stammar delvis från upptäckten att möss som fått båda kopiorna av vissa delar av sina kromosomer från samma förälder inte utvecklas som de ska. När det gäller vissa kritiska gener måste vi ha både en mamma och en pappa. Två kopior från mamma eller två från pappa duger inte. Varför det är så framgår av ovan: om en gen bara uttrycks från kopian som kommer från mamma och båda kopiorna i ett embryo kommer från pappan — då innebär det i praktiken att uttryck av den genen helt saknas — och vad gäller gener som bara uttrycks från pappan, så kommer de överuttryckas istället. (Det kanske kan vara okej för vissa mindre avgörande gener, men tyvärr visar sig flera präglade gener vara viktiga för själva fosterutveckligen.) Det kan förklara varför partenogenes (jungfrufödsel — alltså att en ny individ utvecklas ur ett obefruktat ägg) inte finns bland däggdjur. Avkomman skulle ju då få båda sina kopior av genomet från mamma.

Nu till rubriken! Detta ger oss ett svar på en fråga som dyker upp förvånande ofta: går det inte att skaffa ett barn från två äggceller (eller två spermier), alltså ett barn som även genetiskt har två föräldrar av samma kön? Numera finns det möss som har två mammor och ingen pappa. Hur gick det till? Jo, det behövs såklart något sätt att se till att de där kritiska generna uttrycks i rätt mängd. Tjuvknepet i det här fallet är att den ena musen är transgen — den saknar en gen som kallas H19, ligger strax bredvid Igf2 och är på något ännu okänt sätt inblandad i regleringen av hur Igf2 och några närliggande gener uttrycks. Den förändringen räcker tydligen för att några av musungarna skulle kunna födas och bli vuxna. Om de i övrigt är helt friska förtäljer inte historien (och det är de förmodligen inte).

Det är alltså knappast ett tänkbart sätt att skaffa barn. Men det tyder på att bristen på jungfrufödslar hos däggdjur faktiskt kan förklaras av genetisk prägling, för om bara uttrycket några präglade gener rättas till så fungerar det — åtminstone hjälpligt.

Litteratur

Kono T, Obata Y, Wu Q, Niwa K, Ono Y, Yamamoto Y, Park ES, Seo J-S, Ogawa H. (2004) Birth of parthenogenetic mice that can develop to adulthood. Nature 428 ss. 860–864