因此,我正在编写一个文本文件,我正在对这些文件进行以下行动:
def string_operations(string):
1) lowercase
2) remove integers from string
3) remove symbols
4) stemming
之后,我仍然有以下的str:
durham 28x23
我认为我的做法存在缺陷,但想知道,是否有良好、快速的方法确定是否有与扼杀有关的数字价值。
因此,在上述例子中,我希望产出成为现实。
durham
另一个例子:
21st ammendment
应:
ammendment
因此,我如何处理这一难题?