数据预处理_2

科技前沿 • 2025-03-03 15:08 • 阅读 30

数据预处理_2文章目录一常用数据类型对应的数学模型二特征编码 1 数字编码 2 One Hot 编码三缺失值处理 1 删除法 2 填补法 2 1 均值填补 2 2 随机填补 2 2 1 贝叶斯方法 2 2 2 近似贝叶斯方法 2 3 基于模型的填补 3 其他四数据标准化 1 Z score 标准化 2 Min Max 标准化 3 小数定标标准化 4 Logistic 标准化

大家好，我是讯享网，很高兴认识大家。

文章目录

一、常用数据类型对应的数学模型
二、特征编码
- 1 数字编码
- 2 One-Hot编码
三、缺失值处理
- 1 删除法
- 2 填补法
- - 2.1 均值填补
  - 2.2 随机填补
  - - 2.2.1 贝叶斯方法
    - 2.2.2 近似贝叶斯方法
  - 2.3 基于模型的填补
- 3 其他
四、数据标准化
- 1 Z-score标准化
- 2 Min-Max标准化
- 3 小数定标标准化
- 4 Logistic标准化
- 不同标准化方法的对比
五、特征离散化——将连续型特征转换为离散型特征
- 1 有监督离散化
- - 1.1 信息熵增益离散化
  - 1.2 卡方离散化——ChiMerge方法
  - 1.3 CAIM离散化——类别属性相互依赖最大化
- 2 无监督离散化
- - 2.1 等距离散化
  - 2.2 等频离散化
  - 2.3 基于聚类的离散化
六、离群值检测
- 1 基于统计的方法——拉依达准则（Pauta criterion）
- 2 基于近邻的方法
- - 2.1 K近邻
  - 2.2 局部离群因子算法（Local Outlier Factor，LOF）
其他预处理方法

小讯

2025年音频编码格式介绍-AAC

上一篇 2025-02-06 19:47

NOTAM故障给我们的警示

下一篇 2025-02-16 12:42

2025年音频编码格式介绍-AAC 1735992089
盒子模型与基础操作 1735992088
2025年【翻译-骨盆】A deeplearning tool for fullyautomatedmeasurementsofsagittalspinopelvicbalance from X‑rayimag 1735992087
点分治分点(BFS) 1735992087
莱罗三角形平衡系统 1735992087
2025年app反编译 1735992086
2025年启动图一键生成工具_一键生成高大上的文字云，这5个工具值得推荐。 1735992085
2025年0212-基于单片机的DC降压电源电路设计 1735992084
2025年CCOM是什么？它有什么功能和特性？它值不值得我们去学习？我们该如何去学习呢？ 1735992084
NOTAM故障给我们的警示 1735992090
2025年网络关键设备选型及介绍 1735992090
微信3D小游戏已达数百款，这里肯定有你没玩过的小游戏！ 1735992091
通俗解读NLP中几种常见的注意力机制 1735992092
java单例模式 1735992093
2025年如何把录音生成二维码，用微信扫一下就能听？分享语音音频转二维码的方法和技术原理 1735992094
2022年茶艺师（中级）考试题库及模拟考试 1735992095
2025年项目干系人包括的人群 1735992095
基因名坑你没商量 -- 有关基因名的坑 1735992096

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除。
如需转载请保留出处：https://51itzy.com/kjqy/35239.html