一尘不染

如何建立一个“相关问题”引擎?

mysql

我们较大的网站之一的区域中,用户可以将问题发送给网站所有者,该问题由其工作人员亲自评估。当经常弹出相同的问题时,他们可以将此特定问题添加到常见问题解答中。

为了防止他们每天收到数十个类似的问题,我们希望提供与本网站上“相关问题”类似的功能(堆栈溢出)。

有什么方法可以构建这种功能?我知道我应该以某种方式评估问题并将其与常见问题解答进行比较,但是这种比较是如何进行的?是否提取了关键字?

可能值得一提的是,该站点建立在LAMP堆栈上,因此这些都是可用的技术。

谢谢!


阅读 220

收藏
2020-05-17

共1个答案

一尘不染

我不知道Stack
Overflow的工作原理,但我想它使用标签来查找相关问题。例如,在此问题上,与之相关的前几个问题都带有标记recommendation- engine。我想稀有标签上的匹配比普通标签上的匹配更重要。

您可能还希望查看术语“频率-反向文档频率”

2020-05-17