English 中文(简体)
最快的方式做很多, 很多不同的 gsub 操作?
原标题:Fastest way to do many, many different gsub operations?

我将数以万计的文件从一个标记格式(显然有些RUNOFF的后裔,我拥有极少的文件)转换成我可以提供给 LaTeX 的东西。 部分过程涉及搜索每个文件, 每一个字符串在旧标记格式中具有特殊意义, 并用适合的字符串替换 LaTeX 。 有上百个。 目前我的两个想法是作为单独的 gsub 来做每个文件, 或者用一个与许多符号相匹配( ORing ) 的正格子来做一个 gsub, 然后通过一个大案说明将匹配到一个方法来传递给一个大案说明, 从而传递给合适的替换。 在它的表面上, 第二种方式是减少每个文件必须被扫描的次数, 但雷格克斯 内 OR 的顶端可能更昂贵。 有人知道哪个方法更好, 或者我错过了一个好的方法吗?

以下是我所描述的两种方式的例子。它们可能是不完善的,只是试图把我的观点讲清楚。

方法1:

output.gsub!(/a<-"/,  \"{a} ) # ä
output.gsub!(/a<-^/,  \^{a} ) # â
output.gsub!(/a<-~/,  \~{a} ) # ã
...etc

方法2:

output.gsub!(/a<-"|a<-^|a<-~|etc/) {|match| convert_symbol(match)}

def convert_symbol(input)
  case match
  when  a<-" 
     \"{a}  # ä
  when "a<-^"
     \^{a}  # â
  when "a<-~"
     \~{a}  # ã
  when  etc 
     \LaTeX...etc 
  end
end
问题回答

哇,很多文件。但是我想如果我这样做,我不会担心这个程序的效率。电脑是快速和廉价的,不介意整晚跑步。

事实上,我不认为我会在一般情况下打开代码(输入程序) Regex 表达式。 我认为我会将替换文件放入一个平面或 YAML 文件, 并且只将那些需要状态的表达式或特征输入到程序之中 。

所以,如果我需要记住一个符号,我也许可以把它建成一个符号, 或者把它标在装满转换码表达式的YAML文件中...我会最担心我的程序结构有多好和多么好。我会尽量减少时间与它混杂,并进行测试, 并且至少首先不要担心它的运行速度有多快。

特别是,这个程序一旦完成,每个文件只运行一次。所以它不是认真优化速度的好选择。此外,既然它只运行一次,你就必须永远坚持它的决定,我认为你的重点应该是忠诚而不是速度。

{ /a<-"/ =>  \"{a} , 
  ... 
}.each { |find, replace| output.gsub! find, replace }

这些都是相同的通用格式吗?

output.gsub!(/([aeiouy])<-(["~^])/,  \2{1} )

...假设Ruby在 1 , 2 等有背引号(抱歉,不太熟悉语言)。





相关问题
Ruby parser in Java

The project I m doing is written in Java and parsers source code files. (Java src up to now). Now I d like to enable parsing Ruby code as well. Therefore I am looking for a parser in Java that parses ...

rails collection_select vs. select

collection_select and select Rails helpers: Which one should I use? I can t see a difference in both ways. Both helpers take a collection and generates options tags inside a select tag. Is there a ...

RubyCAS-Client question: Rails

I ve installed RubyCAS-Client version 2.1.0 as a plugin within a rails app. It s working, but I d like to remove the ?ticket= in the url. Is this possible?

Ordering a hash to xml: Rails

I m building an xml document from a hash. The xml attributes need to be in order. How can this be accomplished? hash.to_xml

multiple ruby extension modules under one directory

Can sources for discrete ruby extension modules live in the same directory, controlled by the same extconf.rb script? Background: I ve a project with two extension modules, foo.so and bar.so which ...

Text Editor for Ruby-on-Rails

guys which text editor is good for Rubyonrails? i m using Windows and i was using E-Texteditor but its not free n its expired now can anyone plese tell me any free texteditor? n which one is best an ...

热门标签