Question

I m trying to read a .txt file with the function read.transactions. This is the structure of my file:

1121,1141,1212,1311,1343,2111,2171,2213,2215,2311,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1111,1112,1126,1145,1146,1181,1213,1441,2122,2322,3311,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1172,2131,2173,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1141,1223,1416,2322,2323,112701,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,

• 采用这一代法实施:

tr <- read.transactions("disco.txt", format = "basket", sep= , ,rm.duplicates= TRUE)

但我所看到的是这样的东西(inspect(head(tr)):

我的问题是:我如何从这些交易中删除空洞物品? 这一概念后来适用原始算法,以便制定有吸引力的规则。您是否知道该算法(apriori in R。能够处理这一问题? 我在我刚才所看到的交易中应用了原算法,但许多交易在装上空箱方面毫无用处。

Many thanks in advance! Regards!

Answer 1

我认为,这里的问题是线索。因此,我认为,如果你在使用<代码>阅读的新/经修改的文档中把“、”字放在一边,那是最容易的。

工作不是特别的,而是:

library("arules")

temp <- readLines("stack.dat")
for (i in 1:length(temp))
  temp[i] <- gsub(",*$", "", temp[i])
writeLines(temp, "stack_mod.dat")

tr <- read.transactions("stack_mod.dat", format = "basket", sep= , , rm.duplicates=TRUE)

你们是不是这样吗?

友情链接