输入问题时,stackoverflow会向您提供一份问题列表,它认为这些问题可能涉及同一主题。我在其他网站或其他程序中也看到过类似的功能(例如帮助文件系统),但我自己从未编程过这样的东西。现在我很想知道人们会用什么样的算法来实现这一点。
我想到的第一种方法是将短语分成单词,并寻找包含这些单词的短语。在你这样做之前,你可能想扔掉无关紧要的单词(比如the、a、do等),然后你会想对结果进行排名。
嘿,等等,让我们对网页这样做,然后我们可以有一个。。。手表手表…-一个“搜索引擎”,然后我们可以销售广告,然后。。。
不,说真的,解决这个问题的常用方法是什么?