如何最快(平行?)利用双向操作者在很长的路里找到一种子?
e.g. 在人类基因组中找到“GCCTGAAACA”序列中的所有立场:(770MB)
*the alphabet consists of 4 symbols ( G , C ,T, A ) represented using 2 bits: G :00, A :01, T :10, C :11
* 您可以假定(较短的)定点长度,例如127个特性。
页: 1
* 档案在预处理后将装入记忆中,基本上有数十亿的短体有待在大体内搜索。
* 借用 I m 寻找最简单、最快的方法,在大型轨道阵列中寻找比照型,并尽可能靠近硅。
*KMP wouldn t work well as the alphabet is small
*C代码,x86机码都令人感兴趣。
投入格式说明(2bit):http://jcomeau.freeshell.org/www/genome/2bitformat.html。
相关:
rel=“nofollow noreferer”>。 http://www.arst Design.com/articles/fastsearch.html。