I m 期望把我们从C#到R等更强大的数据采矿平台的各种机器学习算法本土平台。 虽然在很多类型的数据开采任务中,这很显然,但对于我来说,如果能够用于文字分类,这并不明确。
Specifically, we extract a list of bigrams from the text and then classify it into one of 15 different categories, eg:
Bigram list: jewelry, books, watches, shoes, department store -> Category: Shopping
我们想要在R中培训模型,并ook到一个数据库,以便更广泛地做到这一点。
在R?