我们如何基于文本内容进行分类?
时间:2020-03-05 18:54:12 来源:igfitidea点击:
如何根据内容自动查找文本类别?
解决方案
回答
对此有一篇很好的文章:http://www.cs.utexas.edu/users/hyukcho/classificationAlgorithm.html
回答
对内容(文本或者多媒体)进行分类的最佳方法是使用分类法。
大多数众所周知的CMS都内置了对分类法的支持。在各种CMS中,Drupal是分类学的最佳支持之一。
回答
- 阅读数据挖掘:实用的机器学习工具和技术-Ian H. Witten,Eibe Frank
- 使用Weka或者Orange
回答
我鼓励我们查看与自然语言工具包捆绑在一起的文本分类库。即使我们不熟悉Python,我也认为我们会发现API相当直观。 NLTK书中有很多很好的例子,邮件列表中的人也很有帮助。