我正试图从看似类似之处的扼杀中抓捕次。
some string, another string,
我希望结果匹配小组成为该小组。
( some string , another string )
我目前的解决方案
>>> from re import match
>>> match(2 * (.*?), , some string, another string, ).groups()
( some string , another string )
我在此当然显示的是,与我在实际项目中做的工作相比,复杂性大为降低;我只想使用一种简单(非computed)的reg。 不幸的是,我迄今为止的努力失败了:
(因此,None) ,因为{2}只适用于空间,而不适用于整体:
>>> match( .*?, {2} , some string, another string, )
在重复扼杀周围添加括号的母体具有 com和空间,因此
>>> match( (.*?, ){2} , some string, another string, ).groups()
( another string, ,)
加上另一套辅助器确实使我感到fix:
>>> match( ((.*?), ){2} , some string, another string, ).groups()
( another string, , another string )
增加一只未捕获的磁力可改善结果,但仍可评估第一部探测仪。
>>> match( (?:(.*?), ){2} , some string, another string, ).groups()
( another string ,)
我觉得我很接近,但我确实似乎找不到适当的方法。
谁能帮助我? 任何其他办法都看不到吗?
www.un.org/Depts/DGACM/index_spanish.htm 第一次回复之后的最新情况:
First up, thank you very much everyone, your help is greatly appreciated! :-)
As I said in the original post, I have omitted a lot of complexity in my question for the sake of depicting the actual core problem. For starters, in the project I am working on, I am parsing large amounts of files (currently tens of thousands per day) in a number (currently 5, soon ~25, possibly in the hundreds later) of different line-based formats. There is also XML, JSON, binary and some other data file formats, but let s stay focussed.
为了应对多种档案格式,并利用其中许多格式基于线,我创建了一个部分通用的“灰色”模块,在另一个文件之后加载一个文档,适用于每个线,并将一个大型数据结构与对应数据相匹配。 该模块是一个原型,生产版本将需要一个C++版本,因为性能原因,该版本将连接到波斯特:Python,并可能在复杂性清单中增加校外方言。
此外,没有重复,但是目前零到70(或这样)之间数额不一, com并非总是 com,尽管我最初说过的话,但reg形的某些部分将不得不暂时计算;我要说,我有理由尝试和减少动态数额,并尽可能有固定的模式。
页: 1 我必须经常使用“。
www.un.org/Depts/DGACM/index_spanish.htm 重复: 我认为,问题的核心在于:是否存在着一种灰复燃,例如,它涉及 cur的重复,使我得以抓住。
some string, another string,
into
( some string , another string )
?
Hmmm, 可能将其缩小到太远的地方,但你这样做的任何方式都是错误的: D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D.
www.un.org/Depts/DGACM/index_spanish.htm 第二次尝试: 为什么我看不到第一场游行(一些游行)的结果? reg鱼为什么产生配对(指 go有2件),但只剩下1件(第二件)?
即使我使用非数字重复,即使用+而不是{2},问题仍然相同:
>>> match( (?:(.*?), )+ , some string, another string, ).groups()
( another string ,)
而且,这并不是遣返的第二个指示,而是最后一点:
>>> match( (?:(.*?), )+ , some string, another string, third string, ).groups()
( third string ,)
Again, thanks for your help, never ceases to amaze me how helpful peer review is while trying to find out what I actually want to know...