开源全文文章推荐引擎
时间:2020-03-05 18:55:52 来源:igfitidea点击:
我想知道开源项目中是否有任何好的.NET推荐算法,无论是否添加到搜索引擎上。 "推荐"是指可以接受全文的文章,并根据关键字相似性从索引中推荐其他文章。
在高端,有文件分类引擎,例如Autonomy;在低端垃圾邮件过滤器和博客"相关帖子"小部件中。广告与文章的匹配也是可能的。我想将一个项目合并到一个项目中,但负担不起高端,而低端似乎都基于LAMP。
[抱歉,一个答案要求澄清:理想情况下,我正在寻找的是独立库,但是我愿意根据需要改编良好的源代码。最终结果是,我需要能够创建一个Cservice,它接受任意数量的文本并返回类似的先前索引文章的列表。基本上,在我们提交问题时,StackOverflow本身所做的确切工作!]
谢谢!
史蒂夫
解决方案
回答
问题不是很清楚(算法还是库???),但是唯一想到的是Lucene.NET,它是.Net框架上流行的Lucene库的移植。 HTH。
回答
我认为在StackOverflow中,他们从文本中提取所有常见的英语单词,然后将该单词与其他帖子的剩余单词进行比较,以获得"相关"帖子。