Tidigare i veckan handlade det om mänskliga genomsekvenser och jag var lite tjurskallig om det första irländska genomet… Jag borde nog ha nämnt 1000 Genomes Project som är den nya sekvenseringens svar på HapMap och som kommer göra det betydligt mindre hett att publicera analyser av enskilda individers sekvenser — om det inte är något väldigt speciellt med dem…
(Bild från Wikipedia.)
Okej, sekvenseringen av Ozzy Osbournes genom har ännu inte publicerats i någon vetenskaplig tidskrift och bidrar knappast särskilt mycket till mänskligt vetande. 1000 Genomes, däremot, har det ambitiösa målet att hitta i stort sett alla genetiska varianter som förekommer med minst 1% frekvens i populationen. För att åstadkomma det kommer de sekvensera ett stort antal människor från olika delar av världen. (Det är faktiskt inte just 1000 genom som ska sekvenseras, utan mer än 2000.)
Och nu publiceras ett par artiklar baserade på data från deras pilotprojekt. I den stora artikeln i Nature kan vi läsa att de har sekvenserat 179 individer lite ytligare men tillräckligt för att hitta vanliga genetiska varianter; dessutom har de sekvenserat två trios av mor, far och barn mycket noggrannare; och slutligen hos 697 personer den relativt lilla del av genomet som kodar för proteiner. Allt som allt ger det en katalog av genetiska variationer — både SNP:ar och kopievariationer — som de uppskattar täcka 95% av den variation som finns.
I Nature-artikeln och den samtidiga Science-artikeln gör de såklart också en mängd intressanta beräkningar. Bland annat letar de efter genetiska tecken på evolution genom naturligt urval i DNA-sekvensen. Förresten, för den som trodde att det är sekvenseringen och inte analysen som är det jobbiga — titta på projektets hemsida. Den sista sekvenseringen i pilotprojektet var klar i juni 2009. Nature-artikeln mottogs av tidskriften i juli 2010.
Karin Bojs skriver en bra artikel om nyttan av fler genetiska markörer. Men varför inte kosta på sig att länka till artiklarna? Nature-artikel är open access och Science-artikeln kan läsas gratis efter registrering.
(Uppdatering: Strax efter att den här texten postats försvann DN:s artikel igen. Vi får väl se när den kommer tillbaka.)
Litteratur
A map of human genome variation from population-scale sequencing. (2010) Nature 467 ss. 1061-1073. Det blir för mycket även för Nature att skriva ut alla författarnas namn; de listas längst ner på sidan.
Sudamant et al. (2010) Diversity of Human Copy Number Variation and Multicopy Genes. Science 330 ss. 641-646. Här står ”1000 Genomes Project” som en av medförfattarna i listan — och så är det 10 till.