我将R用于我的大部分统计分析。 然而,清洁/处理数据,特别是在处理1Gb+的大小时,非常麻烦。 因此,我使用通用的UNIX工具。 但是,我的问题是,可以说,能否在一次区域会议的中间以互动的方式处理这些议题? 例如:请说<代码>file1是来自一个R过程的产出数据集,有100个浏览。 从此,在我的下一个区域进程中,我需要一个第1和2栏的具体子组,file2
,可通过<代码>cut和awk.
轻易提取。 因此,工作流程类似:
Some R process => file1
cut --fields=1,2 <file1 | awk something something >file2
Next R process using file2
如果这是一个ool问题,预先道歉。