Question

我需要变换一些像这样的数据:

df<-data.frame(Plate=c("4660", "4660", "4660", "4660", "4660", "4660", "4660", "4660", "4660", "4660", "4660"), Well=c("A1", "A2", "A3", "A4", "B1", "B2", "B3", "C1", "C2", "C3", "C4"), Result=c(1, 10, 100, 1000, 1, 10, 100, 1, 10, 100, 1000), Compound=c("C1", "C1", "C1", "C1", "C2", "C2", "C2", "C3", "C3", "C3", "C3"))
cmpds <- ddply(df, .(Compound), .fun = "t")

我想最终得到的是这个:

   1     2     3     4
A  1     10    100   1000
B  1     10    100   NA
C  1     10    100   1000

有办法用 < code> > NA < /code > 填充缺失的 < code > B4 < /code > 行还是忽略它? < code> t < /code > 函数或 < code> ddply 似乎窒息了,因为 < code > B < /code > 的长度与其他的长度不同。

Thanks, J--

Answer 1

@Justin, 我假设你的专栏名称来自井井规格中的数字部分。如果是这样的话, 这里有一个比较一般的解决方案( 将为非单数数字和非单字母工作 ) 。

library("gsubfn")
library("reshape2")

wells <- strapply(as.character(df$Well), ".*([A-Z]+)([0-9]+)", c, simplify=rbind)
colnames(wells) <- c("well.letter", "well.number")
df <- cbind(df, wells)

然后使用 dcast :

> dcast(df, Compound~well.number, value.var="Result")
  Compound 1  2   3    4
1       C1 1 10 100 1000
2       C2 1 10 100   NA
3       C3 1 10 100 1000

如果水平标签毫无意义, 您只想填充您曾经有多少值, 您可以使用 < code> plyr 来做到这一点 :

ddply(df, .(Compound), function(DF) {
  as.data.frame(t(DF$Result))
})

给予

  Compound V1 V2  V3   V4
1       C1  1 10 100 1000
2       C2  1 10 100   NA
3       C3  1 10 100 1000

您想要的并不完全清楚, 因为您示例中的行被贴上好字母的标签, 而代码意味着以复合名称分割。不清楚您真的要什么。

Answer 2

您希望您的行和列成为 Well 列中的字母和数字正确吗? 您可以将这些分成两个新列 :

well.split <- strsplit(df$Well,   )

df$well.letter <- sapply(well.split,  [ , 1)
df$well.number <- sapply(well.split,  [ , 2)

然后我就从 reshape2 套件中使用 dcast 包件:



dcast(df, well.letter~well.number, value.var= Result )

友情链接