Peer review glossary

‘Misleading’ — not exactly as I would have written it

‘Somewhat confusing’ — using terminology from adjacent sub-subfield

‘Confusing’ — completely illegible

‘Poorly structured’ — not exactly as I would have written it

‘Conversational’ — in need of adjectives

‘Descriptive’ — using technology that isn’t fashionable anymore

‘Potentially’ — definitely

‘by a native English speaker’ — by the Microsoft Word spell checker

‘due to insufficient enthusiasm’ — because it’s trite

‘gratefully’ — begrudgingly

‘adequate’ — perfunctory

‘constructive’ — fairly polite

Clearly, obviously

This is my kind of letter to Nature:

This is a friendly suggestion to colleagues across all scientific disciplines to think twice about ever again using the words ‘obviously’ and ‘clearly’ in scientific and technical writing. These words are largely unhelpful, particularly to students, who may be counterproductively discouraged if what is described is not in fact obvious or clear to them.

Clearly, this is easier said than done. It is common writers’ advice to remove adverbs, and to a lesser extent adjectives. These words may be pointless filler words, and when they’re not, there is a risk of telling the reader what to think in a manner that seems impolite. But they also do some work to make the text flow, and prose without them can seem sterile and disconnected.

If we could also get rid of ”surprisingly”, I would be happy.

Balancing a centrifuge

I saw this cute little paper on arxiv about balancing a centrifuge: Peil & Hauryliuk (2010) A new spin on spinning your samples: balancing rotors in a non-trivial manner. Let us have a look at the maths of balancing a centrifuge.

The way I think most people (including myself) balance their samples is to put them opposite of each other, just like Peil & Hauryliuk write. However, there are many more balanced configurations, some of which look really weird. The authors generate three balanced configurations with increasing oddity, show them to researchers and ask them whether they are balanced. About half, 30% and 15% of them identified each configuration as balanced. Here are the configurations:

configuration_plot
(Drawn after their paper.)

Take a rotor in a usual bench top centrifuge. It’s a large, in itself balanced, piece of metal with holes to put microcentrifuge tubes in. We assume that all tubes have the same mass m and that the holes are equally spaced. The rotor will spin around its own axis, helping us separate samples and pellet precipitates etc. When the centrifuge is balanced, the centre of mass of the samples will be aligned with the axis of rotation. So, if we place a two-dimensional coordinate system on the axis of rotation like so,

koordinater

the tubes are positioned on a circle around it:

x_i = r \cos {\theta_i}
y_i = r \sin {\theta_i}

The angle to each position in the rotor will be

\theta(i) = \dfrac{2\pi(i - 1)}{N}

where i is the position in question, starting at 1, and N the number of positions in the rotor. Let’s label each configuration by the numbers of the positions that are occupied. So we could talk about (1, 16)30 as the common balanced pair of tubes in a 30-position rotor. (Yeah, I know, counting from 1 is a lot more confusing than counting from zero. Let’s view it as a kind of practice for dealing with genomic coordinates.)

We express the position of each tube (treated as a point mass) as a vector. Since we put the origin on the axis of rotation, these vectors have to sum to zero for the centrifuge to be balanced.

\sum \limits_{i} {m\mathbf{r_i}} = \mathbf{0}

Since the masses are equal, they can be removed, as can the radius, which is constant, and we can consider the x and y coordinates separately.

\left(\begin{array}{c} \sum \limits_{i} {\cos {\theta(i)}} \\ \sum \limits_{i} {\sin {\theta(i)}} \end{array}\right) = \left(\begin{array}{c} 0 \\ 0 \end{array}\right)

For the (1, 16)30 configuration, the vectors are

\left(\begin{array}{c} \cos {\theta(1)} \\ \sin {\theta(1)} \end{array}\right) + \left(\begin{array}{c} \cos {\theta(16)} \\ \sin {\theta(16)} \end{array}\right) = \left(\begin{array}{c} \cos {0} \\ \sin {0} \end{array}\right) + \left(\begin{array}{c} \cos {\pi} \\ \sin {\pi} \end{array}\right) = \left(\begin{array}{c} 1 \\ 0 \end{array}\right) + \left(\begin{array}{c} -1 \\ 0 \end{array}\right)

So we haven’t been deluding ourselves. This configuration is balanced. That is about as much maths as I’m prepared to do in LaTex in a WordPress blog editor. So let’s implement this in R code:

library(magrittr)
theta <- function(n, N) (n - 1) * 2 * pi / N
tube <- function(theta) c(cos(theta), sin(theta))

Now, we can look at Peil & Hauryliuk’s configurations, for instance the first (1, 11, 14, 15, 21, 29, 30)30

positions <- c(1, 11, 14, 15, 21, 29, 30)
tubes <- positions %>% lapply(theta, N = 30) %>% lapply(tube)
c(sum(unlist(lapply(tubes, function(x) x[1]))),
  sum(unlist(lapply(tubes, function(x) x[2]))))

The above code 1) defines the configuration; 2) turns positions into angles and then tube coordinates; and 3) sums the x and y coordinates separately. The result isn’t exactly zero (for computational reasons), but close enough. Putting in their third configuration, (4, 8, 14, 15, 21, 27, 28)30, we again get almost zero. Even this strange-looking configuration seems to be balanced.

I’m biased because I read the text first, but if someone asked me, I would have to think about the first two configurations, and there is no way I would allow a student to run with the third if I saw it in the lab. That conservative attitude, though not completely scientific, might not be the worst thing. Centrifuge accidents are serious business, and as the authors note:

Finally, non-symmetric arrangement (Fig. 1C) was recognized as balanced by 17% of researchers. Some of these were actually calculating moment of inertia, i.e. were coming to solution knowingly, the rest where basically guessing. The latter should be banished from laboratory practice, since these people are ready to make dangerous decisions without actual understanding of the case, which renders them extremely dangerous in the laboratory settings.

(Plotting code for the first figure is on Github.)

Hönan och ägget

På samma tema som igår, nämligen ofta ställda men lite aviga frågor: vad kom först, hönan eller ägget? Ägget, naturligtvis. Så många av hönans både nära och avlägsna släktingar lägger ägg, vilket betyder att deras gemensamma släktingar med största säkerhet lade ägg och alltså måste ägget vara oerhört, oerhört mycket äldre än hönan som art. Vad kom först, hönan eller hönsägget? Hönsägget, kanske. Det är inte helt enkelt att definiera arter, men om vi föreställer oss att det finns någon punkt där en individer i en population av för-höns ackumulerat tillräckligt många hönslika egenskaper för att vara det vi skulle kalla en höns så började de i alla fall sina liv som ägg. Alltså fanns hönsägg innan det fanns vuxna höns. Eller så är hönor bara en sorts teoretiska efterhandskonstruktioner människor använder för att göra naturens röra hanterbar.

Så kristdemokrater har mest sex, säger ni?

Nja. Två som röstar på kristdemokraterna har mycket sex.

Rplot02

Aftonbladet har köpt någon sorts undersökning om svenskarnas sexvanor. Hoppas det var en god investering; jag tror i alla fall den har genererat löpsedlar ett par dagar. Nu har turen kommit till politiska sympatier och sex. Data finns på United minds hemsida. Kristdemokraterna har alltså minst stickprovsstorlek, men hela två som uppgivit att de haft sex fler än femtio gånger de sista 30 dagarna. Sådana extrema värden kan dra iväg medelvärdet ganska ordentligt, som till exempel i Aftonbladets diagram, vilket därför är rätt missvisande.

Weird juxtapositions happen when you import Wikipedia

The network is available on IntegromeDB public database (http://integromedb.org) under the present manuscript title.

So I went there:

integromedb

Apparently, typing in journal article titles was not what the search field was for. Couldn’t find the network either, but the article is still in provisional pdf form so that may be the reason.

Dragana Stanley, Nathan S Watson-Haigh, Christopher JE Cowled, Robert J Moore. (2013) Genetic architecture of gene expression in the chicken. BMC Genomics 14

Om någon av mina studenter läser det här

Så har ni förhoppningsvis gjort er förtjänta av en välbehövlig paus. Jag vill inte uppmuntra till dryckenskap eller kille-med-gitarrbeteende, men den här söta nördiga videon innehåller i alla fall några kul upplysningar om osmoreglering, cellsignalering samt vår favoritorganism från labb B1.

(Mina och mina … Studenterna är väl sina egna. Dessutom är jag bara med på labbar och hoppar in på ett par föreläsningar. Men det tycker jag är fullt tillräckligt mandat att föreslå youtubeklipp i alla fall.)

Nu ägnar vi ett ögonblick åt att skratta åt vetenskapligt språkbruk

För tillfället är jag inte kapabel att skriva någon längre eller allvarligare bloggpost — plikten kallar lite för mycket. Istället ett par små stycken nördhumor.

1.

Neil Saunders har ritat ett fint diagram:


(Bilden är från Neil Saunders blogg What You’re Doing is Rather Desperate och Creative commons-licensierad.)

Kurvorna visar alltså förekomsten av ordet ”novel” i titlar och sammanfattningar artikeldatabasen PubMed, det totala antalet artiklar i PubMed och till sist frekvensen av artiklar som använder ordet ”novel”.

Som synes ökar det dramatiskt, även med i förhållande till tillväxten av artiklar i PubMed. (Men frekvensen är ändå inte så hög — skalan går ju från 0 till 6%.) Den biomedicinska forskningen blir uppenbarligen bara mer och mer nyskapande. Eller självgod.

(Nördar som vi är kan vi också lägga märke till att Neil använder ggplot2-paketet till R för att rita diagrammet, vilket jag också verkligen borde lära mig.)

2.

Jag gillar ordet genom — som ett snyggare uttryck för en organisms hela DNA-sekvens. Det finns också en viss rimlighet i att kalla studiet av genomet för genomik. Ibland kallas de mRNA-strängar en cell skapar som arbetskopior av gener för transkriptomet; det är lite mindre snyggt men användbart. De proteiner en cell tillverkas kallas på samma sätt proteomet. Och visst, den som studerar transkriptomet eller proteomet kanske sysslar med transkriptomik eller proteomik — eller bara grenar av genomik.

Men vid ”metabolomiken” drar jag min gräns. ”Metabolomet” ska alltså vara de metaboliter, alltså ämnen, som en cell hanterar i alla sina livsprocesser… Vad är det för fel på ”ämnesomsättning”?

Tyvärr är det en ganska populär hobby att hitta på nya -omiker. Evolutionsbiologen Jonathan Eisen brukar lista de riktigt hemska på sin blogg som ”Bad Omics Word of the Day”. Min favorit? miRNAome — antingen outtalbart eller obegripligt (eller både och).

Via hans blogg, Tree of Life, hittar vi också Fields & Johnston, A Crisis in Postgenomic Nomenclature och följande observation:

Perhaps it is not completely coincidental that ‘ome is also the anglicized form of ‘oma (1), commonly used to name such unwelcome intrusions as sarcoma, lipoma, and fibroma. (Mina länkar.)