数据预处理_2

数据预处理_2文章目录 一 常用数据类型对应的数学模型 二 特征编码 1 数字编码 2 One Hot 编码 三 缺失值处理 1 删除法 2 填补法 2 1 均值填补 2 2 随机填补 2 2 1 贝叶斯方法 2 2 2 近似贝叶斯方法 2 3 基于模型的填补 3 其他 四 数据标准化 1 Z score 标准化 2 Min Max 标准化 3 小数定标标准化 4 Logistic 标准化

大家好,我是讯享网,很高兴认识大家。


讯享网

文章目录

  • 一、常用数据类型对应的数学模型
  • 二、特征编码
    • 1 数字编码
    • 2 One-Hot编码
  • 三、缺失值处理
    • 1 删除法
    • 2 填补法
      • 2.1 均值填补
      • 2.2 随机填补
        • 2.2.1 贝叶斯方法
        • 2.2.2 近似贝叶斯方法
      • 2.3 基于模型的填补
    • 3 其他
  • 四、数据标准化
    • 1 Z-score标准化
    • 2 Min-Max标准化
    • 3 小数定标标准化
    • 4 Logistic标准化
    • 不同标准化方法的对比
  • 五、特征离散化——将连续型特征转换为离散型特征
    • 1 有监督离散化
      • 1.1 信息熵增益离散化
      • 1.2 卡方离散化——ChiMerge方法
      • 1.3 CAIM离散化——类别属性相互依赖最大化
    • 2 无监督离散化
      • 2.1 等距离散化
      • 2.2 等频离散化
      • 2.3 基于聚类的离散化
  • 六、离群值检测
    • 1 基于统计的方法——拉依达准则(Pauta criterion)
    • 2 基于近邻的方法
      • 2.1 K近邻
      • 2.2 局部离群因子算法(Local Outlier Factor,LOF)
  • 其他预处理方法
小讯
上一篇 2025-02-06 19:47
下一篇 2025-02-16 12:42

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/35239.html