我们如何基于文本内容进行分类?

时间:2020-03-05 18:54:12  来源:igfitidea点击:

如何根据内容自动查找文本类别?

解决方案

回答

对此有一篇很好的文章:http://www.cs.utexas.edu/users/hyukcho/classificationAlgorithm.html

回答

对内容(文本或者多媒体)进行分类的最佳方法是使用分类法。
大多数众所周知的CMS都内置了对分类法的支持。在各种CMS中,Drupal是分类学的最佳支持之一。

回答

  • 阅读数据挖掘:实用的机器学习工具和技术-Ian H. Witten,Eibe Frank
  • 使用Weka或者Orange

回答

我鼓励我们查看与自然语言工具包捆绑在一起的文本分类库。即使我们不熟悉Python,我也认为我们会发现API相当直观。 NLTK书中有很多很好的例子,邮件列表中的人也很有帮助。