Preprint: ”Genetics of recombination rate variation in the pig”

We have a new preprint posted, showing that recombination rate in the pig is lowly heritable and associated with alleles at RNF212.

We developed a new method to estimate recombinations in 150,000 pigs, and used that to estimate heritability and perform genome-wide association studies in 23,000.

Here is the preprint:

Johnsson M*, Whalen A*, Ros-Freixedes R, Gorjanc G, Chen C-Y, Herring WO, de Koning D-J, Hickey JM. (2020) Genetics of recombination rate variation in the pig. BioRxiv preprint. (* equal contribution)

Here is the abstract:

Background In this paper, we estimated recombination rate variation within the genome and between individuals in the pig for 150,000 pigs across nine genotyped pedigrees. We used this to estimate the heritability of recombination and perform a genome-wide association study of recombination in the pig.

Results Our results confirmed known features of the pig recombination landscape, including differences in chromosome length, and marked sex differences. The recombination landscape was repeatable between lines, but at the same time, the lines also showed differences in average genome-wide recombination rate. The heritability of genome-wide recombination was low but non-zero (on average 0.07 for females and 0.05 for males). We found three genomic regions associated with recombination rate, one of them harbouring the RNF212 gene, previously associated with recombination rate in several other species.

Conclusion Our results from the pig agree with the picture of recombination rate variation in vertebrates, with low but nonzero heritability, and a major locus that is homologous to one detected in several other species. This work also highlights the utility of using large-scale livestock data to understand biological processes.

Using R: simple Gantt chart with ggplot2

Jeremy Yoder’s code for a simple Gantt chart on the Molecular Ecologist blog uses geom_line and gather to prepare the data structure. I like using geom_linerange and a coord_flip, which lets you use start and end columns directly without pivoting.

Here is a very serious data frame of activities:

# A tibble: 6 x 4
  activity       category        start               end                
1 Clean house    preparations    2020-07-01 00:00:00 2020-07-03 00:00:00
2 Pack bags      preparations    2020-07-05 10:00:00 2020-07-05 17:00:00
3 Run to train   travel          2020-07-05 17:00:00 2020-07-05 17:15:00
4 Sleep on train travel          2020-07-05 17:15:00 2020-07-06 08:00:00
5 Procrastinate  procrastination 2020-07-01 00:00:00 2020-07-05 00:00:00
6 Sleep          vacation        2020-07-06 08:00:00 2020-07-09 00:00:00

And here is the code:


activities <- read_csv("activities.csv")

## Set factor level to order the activities on the plot
activities$activity <- factor(activities$activity,
                              levels = activities$activity[nrow(activities):1])
plot_gantt <- qplot(ymin = start,
                    ymax = end,
                    x = activity,
                    colour = category,
                    geom = "linerange",
                    data = activities,
                    size = I(5)) +
    scale_colour_manual(values = c("black", "grey", "purple", "yellow")) +
    coord_flip() +
    theme_bw() +
    theme(panel.grid = element_blank()) +
    xlab("") +
    ylab("") +
    ggtitle("Vacation planning")

Using R: 10 years with R

Yesterday, 29 Feburary 2020, was the 20th anniversary of the release R 1.0.0. Jozef Hajnala’s blog has a cute anniversary post with some trivia. I realised that it is also (not to the day, but to the year) my R anniversary.

I started using R in 2010, during my MSc project in Linköping. Daniel Nätt, who was a PhD student there at the time, was using it for gene expression and DNA methylation work. I think that was the reason he was pulled into R; he needed the Bioconductor packages for microarrays. He introduced me. Thanks, Daniel!

I think I must first have used it to do something with qPCR melting curves. I remember that I wrote some function to reshape/pivot data between long and wide format. It was probably an atrocity of nested loops and hard bracket indexing. Coming right from an undergraduate programme with courses using Ada and C++, even if we had also used Minitab for statistics and Matlab for engineering, I spoke R with a strong accent. At any rate, I was primed to think that doing my data analysis with code was a good idea, and jumped at the opportunity to learn a tool for it. Thanks, undergraduate programme!

I think the easiest thing to love about R is the package system. You can certainly end up in dependency hell with R and metaphorically shoot your own foot, especially on a shared high performance computing system. But I wouldn’t run into any of that until after several years. I was, and still am, impressed by how packages just worked, and could do almost anything. So, the Bioconductor packages were probably, indirectly, why I was introduced to R, and after that, my R story can be told in a series of packages. Thanks, CRAN!

The next package was R/qtl, that I relied on for my PhD. I had my own copy of the R/qtl book. For a period, I probably wrote thing every day:


cross <- read.cross(file = "F8_geno_trim.csv", format = "csv")

R/qtl is one of my favourite pieces or research software, relatively friendly and with lots of documentation. Thanks, R/qtl developers!

Of course it was Dom Wright, who was my PhD supervisor, who introduced me to R/qtl, and I think it was also he who introduced me to ggplot2. At least he used it, and at some point we were together trying to fix the formatting of a graph, probably with some ugly hack. I decided to use ggplot2 as much as possible, and as it is wont to, ggplot2 made me care about rearranging data, thus leading to reshape2 and plyr. ”The magic is not in plotting the data but in tidying and rearranging the data for plotting.” After a while, most everything I wrote used the ddply function in some way. Thank you, Hadley Wickham!

Then came the contemporary tidyverse. For the longest time, I was uneasy with tidyr, and I’m still not a regular purrr user, but one can’t avoid loving dplyr. How much? My talk at the Swedish Bioinformatics Workshop in 2016 had a slide expressing my love of the filter function. It did not receive the cheers that the function deserves. Maybe the audience were Python users. With new file reading functions, new data frames and functions to manipulate data frames, modern R has become smoother and friendlier. Thanks, tidyverse developers!

The history of R on this blog started in 2011, originally as a way to make notes for myself or, ”a fellow user who’s trying to google his or her way to a solution”. This turned into a series of things to help teach R to biologists around me.

There was the Slightly different introduction to R series of blog posts. It used packages that feel somewhat outdated, and today, I don’t think there’s anything even slightly different about advocating RStudio, and teaching ggplot2 from the beginning.

This spawned a couple of seminars in course for PhD students, which were updated for the Wright lab computation lunches, and eventually turned into a course of its own given in 2017. It would be fun to update it and give it again.

The last few years, I’ve been using R for reasonably large genome datasets in a HPC environment, and gotten back to the beginnings, I guess, by using Bioconducor a lot more. However, the package that I think epitomises the last years of my R use is AlphaSimR, developed by colleagues in Edinburgh. It’s great to be able throw together a quick simulation to check how some feature of genetics behaves. AlphaSimR itself is also an example of how far the R/C++ integration has come with RCpp and RCppArmadillo. Thanks, Chris!

In summary, R is my tool of choice for almost anything. I hope we’ll still be using it, in new and interesting ways, in another ten years. Thank you, R core team!

Reflektioner om högskolepedagogik, tagning 2

Kära dagbok,

Mer tankar från fortsättningskurs i högskolepedagogik.

På det andra kurstillfället ägnade vi rätt mycket tid åt ett romantiskt ideal för universitetet: både passet om pedagogisk utveckling i ett större sammanhang och passet om forskningsanknuten undervisning drog mycket inspiration från Humboldts ideal om högre utbildning som en helhet utbildning och forskning, som ska bibringa studenterna bildning och en generell färdighet att tänka självständigt, snarare än ämnes- och yrkeskunskaper.

Det står i högskolelagen och allt:

Verksamheten skall bedrivas så att det finns ett nära samband mellan forskning och utbildning.

Utbildning på grundnivå ska utveckla studenternas
– förmåga att göra självständiga och kritiska bedömningar,
– förmåga att självständigt urskilja, formulera och lösa problem, och
– beredskap att möta förändringar i arbetslivet.

Inom det område som utbildningen avser ska studenterna, utöver kunskaper och färdigheter, utveckla förmåga att
– söka och värdera kunskap på vetenskaplig nivå,
– följa kunskapsutvecklingen, och
– utbyta kunskaper även med personer utan specialkunskaper inom området.

Men lagen skriver också om arbetslivet, yrkesverksamhet och så vidare. Det låter som en blandning av den ovanstående visionen och andra hänsyn, och det överensstämmer kanske med universitetets historia som innehåller både holistisk Humboldt och en start som glorifierat prästseminarium.

Sådant pratade vi alltså om. Vad är ett universitet egentligen? Vad är poängen med den typ av utbildning som vi driver? Jag fick några gånger intrycket att den här delen av kursen handlade om att övertyga oss om att bildningsideal är bra och viktigt.

Men den lokala miljön är förmodligen ännu viktigare än den större inramningen. En bra miljö med kollegor som bryr sig och stöttar varandra hjälper förstås att göra undervisningen bättre. Mårtensson & Roxå (2011) tittade på fyra ”starka akademiska mikrokulturer”, det vill säga ställen på universitet där undervisning och forskning ansågs fungera väldigt bra. Som man kanske kan vänta sig är det här grupper där man håller undervisning för väldigt viktigt, har förtroende för varandra, har goda relationer med andra, och upplever ett gemensamt ärende.

Ärenden ifråga verkade vara långsiktiga mål som var riktade utåt. Poängen var att forma fältet, utbilda studenter som kommer att utveckla yrket, påverka omvärlden. Inte ”att bli en excellent utbildningsmiljö”, eller något sådant som förmodligen står i dokument på högre nivå i organisationen. Författarna använder ordet ”enterprise”. Det påminner om skillnaden mellan extern och intern motivation hos den som lär sig. Klart läraren också blir mer driven av av intern motivation som en önskan att förändra sitt fält, än av extern motivation som att universitetet har en strategi att bli bäst på undervisning.

Det kom också fram att i de här miljöerna såg man undervisning inte bara som väldigt viktigt, utan som något som är oskiljaktigt från forskning. På så sätt ligger de också i linje med Humboldt.

Sätten att göra forskningsanknuten undervisning kan (såklart, som allting annat här i världen, beskrivas med en fyrfälting):

Det vill säga, undervisningen kan vara inriktad på forskningsresultat eller på forskningsprocesser, och det kan vara läraren som berättar eller studenten som gör. Forskningsanknytning kan alltså bestå i uppdatera materialet med det senaste från forskningsfronten (eller i alla fall något senare än det som står i läroboken), avslöja insider-information om hur forskningen går till, låta studenter själva läsa och analysera primär forskningslitteratur, eller låta studenter öva forskningsmetoder. Jag gillade särskilt en formulering som Göran Hartman använde om uppgifter där det inte finns en färdig lösning ”som ni lärare sitter och tjuvhåller på”.

Har jag jobbat något med forskningsanknytning? Ja, mest i det lärarledda innehållsinriktade hörnet. Det är ju bland det roliga med att göra en ny föreläsning, att försöka hitta någon forskningsartikel att passa in. Förstå min glädje när jag såg ett Tinbergen-citat mitt i en tung Drosophila-genetikstudie (Hoopfer et al 2015) och hittade en ursäkt att ta med den i en gästföreläsning om beteendegenetik. Det var ett litet exempel, men ändå.

Jag lärde mig också ett nytt fint ord. Jag hade ingen aning om att det rätt prosaiska svenska ”forskningsanknuten undervisning” på engelska heter ”the research–teaching nexus”. Fint ska det vara.

Using R: from plyr to purrr, part 0 out of however many

This post is me thinking out loud about applying functions to vectors or lists and getting data frames back.

Using R is an ongoing process of finding nice ways to throw data frames, lists and model objects around. While tidyr has arrived at a comfortable way to reshape dataframes with pivot_longer and pivot_wider, I don’t always find the replacements for the good old plyr package as satisfying.

Here is an example of something I used to like to do with plyr. Don’t laugh!

Assume we have a number of text files, all in the same format, that we need to read and combine. This arises naturally if you run some kind of analysis where the dataset gets split into chunks, like in genetics, where chunks might be chromosomes.

## Generate vector of file names
files <- paste("data/chromosome", 1:20, ".txt", sep = "")

genome <- ldply(files, read_tsv)

This gives us one big data frame, containing the rows from all those files.

If we want to move on from plyr, what are our options?

We can go old school with base R functions lapply and Reduce.


chromosomes <- lapply(files, read_tsv)
genome <- Reduce(rbind, chromosomes)

Here, we first let lapply read each file and store it in a list. Then we let Reduce fold the list with rbind, which binds the data frames in the list together, one below the other.

If that didn’t make sense, here it is again: lapply maps a function to each element of a vector or list, collecting the results in a list. Reduce folds the elements in a list together, using a function that takes in two arguments. The first argument will be the results it’s accumulated so far, and the second argument will be the next element of the list.

In the end, this leaves us, as with ldply, with one big data frame.

We can also use purrr‘s map_dfr. This seems to be the contemporary most elegant solution:


genome <- map_dfr(files, read_tsv)

map_dfr, like good old ldply will map over a vector or list, and collect resulting data frames. The ”r” in the name means adding the next data frame as rows. There is also a ”c” version (map_dfc) for adding as columns.

Things that really don’t matter: megabase or megabasepair

Should we talk about physical distance in genetics as number of base pairs (kbp, Mbp, and so on) or bases (kb, Mb)?

I got into a discussion about this recently, and I said I’d continue the struggle on my blog. Here it is. Let me first say that I don’t think this matters at all, and if you make a big deal out of this (or whether ”data” can be singular, or any of those inconsequential matters of taste we argue about for amusement), you shouldn’t. See this blog post as an exorcism, helping me not to trouble my colleagues with my issues.

What I’m objecting to is mostly the inconsistency of talking about long stretches of nucleotides as ”kilobase” and ”megabase” but talking about short stretches as ”base pairs”. I don’t think it’s very common to call a 100 nucleotide stretch ”a 100 b sequence”; I would expect ”100 bp”. For example, if we look at Ensembl, they might describe a large region as 1 Mb, but if you zoom in a lot, they give length in bp. My impression is that this is a common practice. However, if you consistently use ”bases” and ”megabase”, more power to you.

Unless you’re writing a very specific kind of bioinformatics paper, the risk of confusion with the computer storage unit isn’t a problem. But there are some biological arguments.

A biological argument for ”base”, might be that we care about the identity of the base, not the base pairing. We note only one nucleotide down when we write a nucleic acid sequence. The base pair is a different thing: that base bound to the one on the other strand that it’s paired with, or, if the DNA or RNA is single-stranded, it’s not even paired at all.

Conversely, a biochemical argument for ”base pair” might be that in a double-stranded molecule, the base pair is the relevant informational unit. We may only write one base in our nucleotide sequence for convenience, but because of the rules of base pairing, we know the complementing pair. In this case, maybe we should use ”base” for single-stranded molecules.

If we consult two more or less trustworthy sources, The Encylopedia of Life Sciences and Wiktionary, they both seem to take this view.

eLS says:

A megabase pair, abbreviated Mbp, is a unit of length of nucleic acids, equal to one million base pairs. The term ‘megabase’ (or Mb) is commonly used inter-changeably, although strictly this would refer to a single-stranded nucleic acid.

Wiktionary says:

A length of nucleic acid containing one million nucleotides (bases if single-stranded, base pairs if double-stranded)

Please return next week for the correct pronunciation of ”loci”.


Dear, P.H. (2006). Megabase Pair (Mbp). eLS.

Reflektion om högskolepedagogik, apropå kurs

Kära dagbok,

Det finns väl inget utryck som för en att låta så mycket som en universitetslärare som ”reflektion”. Det skulle vara om ordet står i plural och stavas med x. Jag går en fortsättningskurs i högskolepedagogik just nu, och det får mig att tänka på lärande.

En positiv bieffekt är att den låter mig resa till Alnarp, ett av SLU:s andra campusområden. Det är fint där.

För det första är jag förvånad över hur mycket som sitter kvar från grundkursen jag gick som doktorand. Men för säkerhets skull, för jag hade känslan av att jag lärde mig ganska lite då, skummade jag igenom Biggs & Tang (2011), kursboken för SLU:s grundkurs i högskolepedagogik. Den håller hårt på constructive alignment av mål, aktiviteter och examination: idén att en bra kurs först definierar var studenterna ska kunna i slutet av den, och sedan övar och examinerar den just detta. Det är viktigt att precisera just vad ”kunna” betyder i sammanhanget: ska studenterna kunna förklara begrepp, ska de kunna lösa problem, eller ska de kunna bygga en maskin? I så fall bör de få öva sig på att förklara, eller bygga maskiner, och examineras på sin förmåga att förklara, eller bygga maskiner. Det är en av de där förrädiskt enkla idéerna som kan leda till dramatiska förändringar om man tar den på allvar.

Jag tänker förstås tillbaka på när jag var student. En del kurser var exemplariska i att sätta oss i basgrupper där vi fick förklara begrepp för varandra eller laborationer där vi fick lösa problem. En gästföreläsare (vars namn jag glömt; hon kom från Rättsmedicinalverket, tror jag) gav en 15 minuters introduktion till sitt ämne. Sedan lät hon oss tänka ut vad vi ville veta, formulera frågor, och sedan byggde hon resten av föreläsningen kring dem. Intressant sätt att både ge studenterna ansvar och hjälpa henne tackla vår förförståelse av ämnet. Modigt också. Annat var mindre exemplariskt; många sömniga föreläsningar blev det.

Själv har jag ofta tänkt, och sagt, ungefär ”tänk om jag kunde gå tillbaka och göra om de där första årens kurser med allt jag lärt mig om att lära mig”. I viss mån är det säkert sant att jag blev bättre på att lära mig. De sista åren som student fick jag till exempel för mig att organisera mina anteckningar som färgglada tankekartor, och repetera genom att titta på delar av dem och förklara dem för mig själv. Det var säkert inte helt tokigt. Å andra sidan, mycket av det jag lärde mig om att lära mig var nog också att strategiskt och ytligt ta in det som behövdes för att lyckas med tentan. På så sätt är det kanske till och med möjligt att lära sig sämre sämre med mer erfarenhet.

Som deltagare i en kurs om pedagogik fäster en naturligtvis extra uppmärksamhet vid hur undervisningen går till. Lever lärarna som de lär? Och vilka aktiviteter kan jag snappa upp och själv använda, helst de som inte kräver att kursen designas om i grunden utan bara annan användning av den tid och de resurser som finns? Kursen har inte gjort mig besviken så långt. Den fungerar verkligen som demonstration av sitt eget innehåll, med massor av små think–pair–share-moment, tillverkning av konceptkartor i grupper, gott om tid till diskussion, och aktiviteter som låter oss använda det vi läst in oss på i förväg, så att det får förberedelsen att kännas meningsfull.

Ett par höjdpunkter från de första kurstillfällena:

Linn Areskoug från enheten för pedagogisk utveckling samt från Uppsala universitet pratade om normkritik. Rubriken var ”könsmedveten undervisning”, men som sig bör var innehållet ifrågasättande även mot den idén. Det slog mig också under föreläsningen att föreläsningsstilen till stod del bestod av att problematisera de begrepp som just introducerats med en serie exempel och öppna frågor. När syftet var att åhörarna skulle tänka över identitet och ifrågasätta saker som känns uppenbara för oss, är det kanske en bra strategi. Jag undrar om det skulle gå att presentera svåra problem inom genetik på ett liknande sätt, med betoningen på frågorna, inte svaren.

Alexis Engström från Uppsala universitet gav oss, bland annat, bokstavligt talat en lista på aktiviteter som bryter med traditionell undervisning. Det jag tyckte lät mest spännande var ”Det saknade perspektivet”: att lämna ett pass i schemat öppet och ge studenterna i uppgift att fylla det med innehåll och aktiviteter som de tycker saknas i kursen, lite som en storskalig variant av vad gästföreläsaren från Rättsmedicinalverket gjorde.

Jag hoppas få med mig några saker jag kan göra för att vara en bättre lärare, och förstå lite bättre hur lärande fungerar. Som bonus har jag i alla fall roligt.


Biggs J & Tang C. (2011) Teaching for quality learning at university. 4th edition. Open University Press.

If research is learning, how should researchers learn?

I’m taking a course on university pedagogy to, hopefully, become a better teacher. While reading about students’ learning and what teachers ought to do to facilitate it, I couldn’t help thinking about researchers’ learning, and what we ought to do to give ourselves a good learning environment.

Research is, largely, learning. First, a large part of any research work is learning what is already known, not just by me in particular; it’s a direct continuation of learning that takes place in courses. While doing any research project, we learn the concepts other researchers use in this specific sub-subfield, and the relations between them. First to the extent that we can orient ourselves, and eventually to be able to make a contribution that is intelligible to others who work there. We also learn their priorities, attitudes and platitudes. (Seriously, I suspect you learn a lot about a sub-subfield by trying to make jokes about it.) We also learn to do something new: perform a laboratory procedure, a calculation, or something like that.

But more importantly, research is learning about things no-one knows yet. The idea of constructivist learning theory seems apt: We are constructing new knowledge, building on pre-existing structures. We don’t go out and read the book of nature; we take the concepts and relations of our sub-subfield of choice, and graft, modify and rearrange them into our new model of the subject.

If there is something to this, it means that old clichéd phrases like ”institution of higher learning”, scientists as ”students of X”, and so on, name a deeper analogy than it might seem. It also suggests that innovations in student learning might also be good building blocks for research group management. Should we be concept mapping with our colleagues to figure out where we disagree about the definition of ”developmental pleiotropy”? It also makes one wonder why meetings and departmental seminars often take the form of sage on the stage lectures.

Forskare vill prata om den nya gentekniken, men vem vill prata med forskare?

Forskare: ”Vi måste prata!”

Tystnad. Gryllidae-läten hörs i bakgrunden.

Andra forskare: ”Äh, håll tyst!”

För några veckor sedan kom det en debattartikel i SvD: ”Vi måste ta ställning till (eller samtala om, beroende på var på sidan man läser) den nya gentekniken” från ett gång forskare kopplade till gruppen CRISPRideas vid Pufendorfinstitutet vid Lunds universitet. Deras uppgift verkar vara att analysera hur genredigeringstekniker som CRISPR/Cas debatteras:

Genom jämförande analyser av debatten i framförallt de nordiska länderna, men även globalt, kommer vi att undersöka hur vetenskaplig kunskap, värderingar och normer har påverkat såväl experter som allmänheten och olika intressenter i deras uppfattning om de nya genredigeringsteknikernas möjligheter och risker.

Det förefaller som att debattartikeln skrevs i samband med deras möte ”Medical and agricultural perspectives on new genome editing technologies” i november, och det ser ut att ha varit ett kul möte.

Synd att debattartikeln blev tråkig. Men det är kanske inte så konstigt. Om man är en grupp forskare med olika bakgrund ens mandat är att undersöka om en debatt, så är kanske den mest naturliga åsikten att driva att en bred debatt är bra och nödvändig.

Det kan låta som en åsikt som det är svårt att invända mot, men komiskt nog finns det andra som gör det. För strax därpå tyckte Jesper Sundström och Torbjörn Fagerström att det var ”Risk för ohederlig debatt om gensaxen”.

Några kommentarer om debattartikeln. Jag förstår att de hade begränsat utrymme, men här på min blogg kan jag breda ut mig hur mycket jag vill, så vi kan titta närmare på några påståenden.

Get some of that prime jive, get some of that, get get get down

Artikeln börjar med prime-redigering, en ny variant av CRISPR/Cas-redigering som publicerades nyligen (Anzalone & al 2019). Det är tydligen på grund av den som det är extra viktigt att debattera. (Oklart vad det borde heta på svenska: ”prime” är ”början” eller ”start”, som i ”primer”, en kort RNA eller DNA-bit som hjälper en enzymatisk dna-kopiering starta.)

Idén med prime-redigering är att istället för att klippa av hela dna-strängen och klistra ihop den med en ny, så tar man bara av halva i taget, för att inte råka ha sönder för mycket, och syntetiserar det nya dna:t på plats, så att det säkert kommer i kontakt med den nyklippta dna-strängen. Det är en påhittig konstruktion som kombinerar CRISPR-systemet, stulet från bakterier, med omvänt transkriptas, stulet från virus.

Varför behövs all den här påhittigheten? För att genredigering i själva verket fungerar ganska dåligt. Att slå ut en gen i cellkultur är en relativt smal sak: klipp ett hål och låt cellen klistra ihop den bäst den kan, förmodligen blir resultatet en trasig gen. Men att byta ut en variant av en gen med en annan är svårare; majoriteten av försöken misslyckas. Det är okej i labbet, när det bara är att odla nya celler och försöka igen. Det skulle vara mindre okej i en genterapisituation där en patient ska få en ny fungerande genvariant. Prime-redigering kanske är lösningen.

Det är inte lätt att veta om prime-redigering kommer bli det nya, eller om det bara är en i serien av olika förfinade CRISPR/Cas-varianter. Som utgångspunkt för debatt ställer den inga nya frågor som inte redan ställs av tidigare CRISPR/Cas-varianter, precis som CRISPR/Cas inte leder till några nya frågor som inte redan ställdes av rekombinant DNA och fosterdiagnostik. Däremot kanske den gör att genredigering blir lättare att få att fungera, och på så sätt kan de frågorna bli mer aktuella.

Har prime-redigering botat 175 genetiska sjukdomar? Nej, ännu inte en enda.

I debattartikeln beskriver de vad prime-redigering kan göra så här. Det är föredömligt korrekt, men det är ändå värt att understryka vad det betyder:

David Liu och hans forskargrupp visar att den nya gensaxen fungerar anmärkningsvärt väl: de lyckades korrigera ett häpnadsväckande antal mutationer (175 stycken!) i olika celler från möss och människor. Bland annat har man lyckats korrigera de tidigare svåråtkomliga sjukdomsmutationerna som orsakar sickelcell-anemi och den allvarliga nervsjukdomen Tay Sachs sjukdom. Möjligheterna med tekniken är stora. Liu och hans forskargrupp hävdar att över 80 procent av alla nu kända sjukdomsalstrande mutationer kan korrigeras med prime-redigering. (min kursivering)

Det prime-redigering löser är att den gör det lättare att faktiskt redigera, inte bara ta sönder. Det har varit svårt för CRISPR/Cas i praktiken att ersätta en genvariant med en annan. Men för att göra någon form av genterapi med prime-redigering måste någon också se till att det går att rikta redigeringarna till det organ eller den vävnad där problemet finns, och visa att det är tillräckligt att den fungerande genvarianten uttrycks där för att sjukdomsförloppet ska vändas, eller åtminstone avstanna.

Är de dna-redigerade kinesiska barnen skyddade mot hiv?

Sedan pratar de om det kinesiska fallet med barn som (under falska förespeglingar) fått sitt dna-redigerat i en gen som har med hiv-infektion att göra. Den här formuleringen, däremot, är så slarvig att den inte riktig är sann:

I fjol använde en kinesisk forskare Crispr för att förändra arvsmassan hos foster så att de skyddas mot hiv. Detta ledde till en storm i forskarvärlden eftersom permanent förändring av arvsmassan, som förs vidare till kommande generationer, är förbjudet i Sverige och många andra länder.

Det finns inget snällare sätt att beskriva kunskapsläget än att den kinesiska forskaren (He Jiankui) hoppades att barnen skulle bli resistenta mot hiv. Det är inte alls säkert att de faktiskt är resistenta. Vad han gjorde var att klippa hål i genen CCR5 som kodar för en av de receptorer som hiv kan använda för att komma in i cellen. Mutationerna var inspirerade av en allel som kallas CCR5-delta32 och som ger resistens mot vissa typer av hiv genom att slå ut receptorn. Förmodligen har mutationerna som barnen bär på också den effekten att de slår ut receptorn, och i så fall är de förmodligen resistenta mot vissa typer av hiv. Dessutom är det mycket möjligt att barnen har olika mutationer i olika delar av kroppen, så de kanske har en fungerande CCR5 i vissa kroppsdelar och en trasig i andra.

Jag tycker det är fel att koncentrera sig på att det var en permanent förändring i arvsmassan, som om det var det enda problemet. Att barnen, när de växer upp, kommer behöva oroa sig för om eventuella problem går i arv är illa, men det är bara ett i en rad av risker de utsätts för. Det är frågan om en oprövad behandling, med helt okända biverkningar, dåligt genomförd (fråga vem som helst som jobbat med CRISPR/Cas själv vad de tycker om Jiankuis kvalitetskontroll av redigeringar), utförd på ofödda barn vars föräldrar nästan säkert fått bristfällig information … Att lägga fram det som om det var frågan om en behandling som faktiskt gjorde nytta, men som tyvärr är ärftlig är att missa poängen.

Finns det någon risk att Sverige hamnar på efterkälken pga av etiska kval?

Författarna oroar sig, efter det kinesiska fallet, att genredigering ska förbjudas och Sverige på något sätt hamna på efterkälken. Det hade varit hjälpsamt om de givit något exempel på vem i Sverige som tycker detta?

Eftersom det finns en stark opinion mot GMO och det är svårt att få tillstånd för odling av GMO-baserade grödor i Europa har den nya regleringen kraftigt bromsat forskningen inom området. Det hindrar utvecklingen av hållbara grödor. Skulle samma sak drabba Crispr-tekniker för medicinsk tillämpning kommer den vetenskapliga utvecklingen att stanna av och våra möjligheter att bota allvarliga genetiska sjukdomar kommer att reduceras.

Genetiska förändringar i människor som går i arv är inte tillåtet i Sverige, oavsett teknik (Lag (2006:351) om genetisk integritet m.m.). Som synes är lagen från 2006, så inget nytt under solen.

Debatt om debatten om debatten

Till sist, det här är kanske långsökt, men debatten om debatten fick mig att tänka på detta fina referat av svensk lärd debatt från Tage Danielssons Grallimatik (1966).

Professor Gunnar Biörck:
Jag gör mig härmed till tolk för en tigande opinion som ogillar normlöshet och trolöshet och den junta av kulturradikaler som skriver om sånt.

Fil. dr Olof Lagercrantz:
Det är farligt med okunniga professorer.

Fil. lic. Johan Asplund:
Naturvetenskaparna borde någon gång säga något.

Naturvetenskaparna borde någon gång säga något. Det tycker undertecknarna också:

I vårt tvärvetenskapliga projekt vid Pufendorfinstitutet på Lunds universitet – CRISPRideas – bryts naturvetenskapliga och medicinska synsätt mot etiska, filosofiska, juridiska och humanistiska synsätt. Det har vidgat våra vyer och stärkt oss i vår uppfattning att det vetenskapliga samfundet kan och skall vara en partner i svåra men viktiga samtal. Björnen har lämnat sitt ide – den är inte farlig, bara man är varlig! (Slutklämmen på slutrepliken, ”Att inte debattera är inte ett alternativ”.)


Antonio Regalado. (2019) China’s CRISPR: babies. MIT Technology Review.

Andrew V Anzalone et al. (2019) Search-and-replace genome editing without double-strand breaks or donor DNA. Nature.

Two distinguishing traits of science are that there are errors all the time and that almost no-one can reproduce anything

I got annoyed and tweeted:

”If you can’t reproduce a result, it isn’t science” … so we’re at that stage now, when we write things that sound righteous but are nonsense.

Hashtag subtweet, I guess. But it doesn’t matter who first wrote the sentence I was complaining about; they won’t care what I think, and I’m not out to debate them. I only think the quoted sentence makes sense if you take ”science” to mean ”the truth”. The relationship between science and reproducibility is messier than that.

The first clause could mean a few different things:

You have previously produced a result, but now, you can’t reproduce it when you try …

Then you might have done something wrong the first time, or the second time. This is an everyday occurrence of any type of research, that probably happens to every postdoc every week. Not even purely theoretical results are safe. If the simulation is stochastic, one might have been interpreting noise. If there is an analytical result, one might have made an odd number of sign errors. In fact, it is a distinguishing trait of science that when we try to learn new things, there are errors all the time.

If that previous result is something that has been published, circulated to peers, and interpreted as if it was a useful finding, then that is unfortunate. The hypothetical you should probably make some effort to figure out why, and communicate that to peers. But it seems like a bad idea to suggest that because there was an error, you’re not doing science.

You personally can’t reproduce a results because you don’t have the expertise or resources …

Science takes a lot of skill and a lot of specialised technical stuff. I probably can’t reproduce even a simple organic chemistry experiment. In fact, it is a distinguishing trait of science that almost no-one can reproduce any of it, because it takes both expertise and special equipment.

No-one can ever reproduce a certain result even in principle …

It might still be science. The 1918 influenza epidemic will by the nature of time never happen again. Still, there is science about it.

You can’t reproduce someone else’s results when you try with a reasonably similar setup …

Of course, this is what the original authors of the sentence meant. When this turns out to be a common occurrence, as people systematically try to reproduce findings, there is clearly something wrong with the research methods scientists use: The original report may be the outcome of a meandering process of researcher degrees of freedom that produced a striking result that is unlikely to happen when the procedure is repeated, even with high fidelity. However, I would say that we’re dealing with bad science, rather than non-science. Reproducibility is not a demarcation criterion.

(Note: Some people reserve ”reproducibility” for the computational reproducibility of re-running someone’s analysis code and getting the same results. This was not the case with the sentence quoted above.)