我正在使用re.findall()从HTML文件中提取一些版本号:
>>> import re
>>> text = "<table><td><a href="url">Test0.2.1.zip</a></td><td>Test0.2.1</td></table> Test0.2.1"
>>> re.findall("Test([.0-9]*)", text)
[ 0.2.1. , 0.2.1 , 0.2.1 ]
but I would like to only get the ones that do not end in a dot. The filename might not always be .zip so I can t just stick .zip in the regex.
我想要最终得到:
[ 0.2.1 , 0.2.1 ]
有人能建议使用更好的正则表达式吗? :)