什么是search.twitter.com的"趋势主题"算法?

时间:2020-03-06 14:49:31  来源:igfitidea点击:

Twitter使用什么算法来确定我们可以在search.twitter.com上看到的10个主题?我想实现该算法,并且还想展示50个最受欢迎的主题(而不是10个)。我们能描述最有效的算法吗?

谢谢!

(可以在http://apiwiki.twitter.com/REST%20API%20Documentation中找到Twitters API)

另外,我希望能够通过搜索公共时间轴来实现该算法http://twitter.com/statuses/public_timeline.rss

解决方案

因此,Twitter可能要做的是计算特定术语的提及次数减去停用词(停用词,例如:do,me,you,i,not,on等)。
因此,"猫从袋子里拿出来"和"我的狗把我的猫吃掉了"意味着猫,狗和袋子将是它提取的术语(其余均为停用词)
然后将"猫"作为2个引用,因此在这种情况下,"猫"将成为一个热门话题。