🤵♂️ 个人主页:@艾派森的个人主页
✍🏻作者简介:Python学习者
🐋 希望大家多多支持,我们一起进步!😄
如果文章对你有帮助的话,
欢迎评论 💬点赞👍🏻 收藏 📂加关注+

目录
Tomotopy简介
Tomotopy的性能
实战案例
1.加载数据
2.中文分词
3. 确定主题数K
4.训练模型
5.可视化
6.预测
补充:指定主题特征词
文末推荐

Tomotopy简介
tomotopy 是 tomoto(主题建模工具)的 Python 扩展,它是用 C++ 编写的基于 Gibbs 采样的主题模型库。支持的主题模型包括 LDA、DMR、HDP、MG-LDA、PA 和 HPA, 利用现代 CPU 的矢量化来最大化速度。
当前版本的 tomotopy 支持的主题模型包括:
- 潜在狄利克雷分配(LDAModel)
- 标记的 LDA(LLDA 模型)
- 部分标记的 LDA(PLDA 模型)
- 监督LDA(SLDA模型)
- Dirichlet 多项回归 (DMRModel)
- 广义狄利克雷多项回归 (GDMRModel)
- 分层狄利克雷过程 (HDPModel)
- 分层LDA(HLDA模型)
- 多粒 LDA(MGLDA 模型)
- 弹珠盘分配(PAModel)
- 分层 PA (HPAModel)
- 相关主题模型(CTModel)
- 动态主题模型 (DTModel)
- 基于伪文档的主题模型(PTModel)。
安装
pip install tomotopy
讯享网

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/47722.html