2025年数据挖掘实践（一）：亲和性分析

科技前沿 • 2025-02-25 16:22 • 阅读 71

数据挖掘实践（一）：亲和性分析亲和性分析根据样本个体物体之间的相似度确定他们关系的亲疏探索各变量间的关系一应用场景 1 向网站用户提供多样化的服务或投放定向广告 2 为了向用户推荐电影或商品而卖给他们一些与之相关的小玩意 3 根据基因寻找有亲缘关系的人测量方法

大家好，我是讯享网，很高兴认识大家。

亲和性分析---根据样本个体（物体）之间的相似度，确定他们关系的亲疏，探索各变量间的关系。

一、应用场景：

1.向网站用户提供多样化的服务或投放定向广告

2.为了向用户推荐电影或商品，而卖给他们一些与之相关的小玩意

3.根据基因寻找有亲缘关系的人

测量方法：统计两件商品一起出售的频率，或者统计顾客购买了商品X后再买商品Y的比率，或者计算个体之间的相似度。

简单的规则排序：记一条规则为“如果一个人买了X,那么他很有可能购买Y。”找出规则后，还需要判断其优劣，我们挑好的规则用。规则的优劣有多种衡量方法，常用的是支持度（support）和置信度（confidence）。

支持度：支持度衡量的是给定规则应验的比例。

置信度：置信度衡量的则是规则准确率如何，即符合给定条

件（即规则的“如果”语句所表示的前提条件）的所有规则里，跟当前规则结论一致的比例有多

大。计算方法为首先统计当前规则的出现次数，再用它来除以条件（“如果”语句）相同的规则

数量。

二、以顾客购买面包、牛奶、奶酪、苹果和香蕉5种水果的交易记录为例。

1.加载数据集--affinity_dataset.txt

import numpy as np dataset_filname = "affinity_dataset" x = np.loadtxt(dataset_filname) print(x[:5])

上述代码的运行结果为前5次交易中，顾客都买了什么。

小讯

2025年设备英文有多少种叫法？

上一篇 2025-04-10 12:45

《神经质人格》摘录（导言，第一章）

下一篇 2025-02-10 14:07

2025年设备英文有多少种叫法？ 1735995449
服务器端介绍 1735995447
【力扣141-环形链表】覆盖标记法（golang） 1735995447
牛顿恒等式牛顿和 1735995446
forager有多少个机器人_浮岛物语几种机器人 1735995446
http 401 错误 1735995445
卡巴斯基实验室被攻陷后的四个未解之谜 1735995445
2025年水土保持功能评估中k值的计算公式 1735995443
2025年94个比付费软件更好的免费软件 1735995443
《神经质人格》摘录（导言，第一章） 1735995450
2025年html宋体四号字如何设置,宋体小四字体是多少号首先打开WORD文档，进入界面 1735995452
【C++】POCO学习总结（六）：线程、线程池、同步 1735995453
c语言程序设计CDIO,C语言程序设计(基于CDIO思想)(第2版) 1735995453
2025年颜色大全网址 1735995454
FastDFS入门笔记 1735995454
2025年数据科学知识点 1735995455
2025年-行业洞察·趋势报告-《西芒杜建设如火如荼-铁矿供应保障有望增强》 1735995456
LBS应用简介及值得关注的方向 1735995456

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除。
如需转载请保留出处：https://51itzy.com/kjqy/41382.html