Sklearn,是一个python库,专门用于机器学习的模块。包括了分类,回归,无监督,数据降维,数据预处理等常见的机器学习算法。推荐使用Anaconda,本身自带了很多常用的库,而且安装库也特别的方便。本次学习主要了为了进行长文本的分类。
目录
0.TFIDF
1.线性分类
2.SVM分类
3.KNN
4.朴素贝叶斯
5.多层感知器分类器(MLPClassifier)
0.TFIDF
个人感觉比gensim中的好用,因为有很多参数可以对数据进行处理,比如过滤词汇、归一化等等。
vec = TfidfVectoriz
讯享网

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/50830.html