badcase 探索与召回分析

badcase 探索与召回分析1 badcase 探索 1 1 一个 fid 对应多个品牌 这样的指纹一般都有问题 select fid count 1 from select fid brand from test table name group by fid brand t group by fid having count 1 gt 1 1 2 同一用户

大家好,我是讯享网,很高兴认识大家。

1. badcase 探索

1.1 一个fid对应多个品牌

这样的指纹一般都有问题

select fid, count(1) from ( select fid, brand from test.table_name group by fid, brand ) t group by fid having count(1)>1;

讯享网

1.2 同一用户、同一场景、同一时间上报多次情况

讯享网select user_id, user_scence, msg_upload_time, count(1) from ( select user_id, user_scence, from_unixtime(cast(msg_upload_time/1000 as bigint),'yyyy-MM-dd HH:mm:ss') as msg_upload_time from test.table_name ) t group by user_id, user_scence, msg_upload_time having count(1)>1;

1122

2. 召回分析

        基于线上指纹召回真实数据情况,统计设备指纹命中策略及其对应分布,及子指纹覆盖度,分析指纹召回准确性及是否存在过度召回等情况。

2.1 首次匹配到的子指纹分布

策略编号

策略规则

cnt

rate

备注

gk2  

A + B1 + C1

15310

46.23%

新设备

9631

29.08%

gk1

A + B2 + C2

7508

22.67%

gk6

A + B3 + C3

654

1.97%


讯享网

2.2 匹配到的多个子指纹分布

备注:A、B等指标覆盖度高,唯一性也相对较高。

策略编号

策略规则

子指纹匹配数量

匹配率

备注

gk8

A + B + C

23469

70.86%

gk10

A + B1 + C1

23464

70.85%

gk2

22816

68.89%

2.3 指纹表命中结果解析

-- select '000000000000000000000000' as res1 select t.*, coalesce(gk1_res, gk2_res, gk35_res) as res1_new -- 第一个非null的 from ( select t1.*, if(split(res1, '')[0]='1', 'gk1', null) as gk1_res, if(split(res1, '')[1]='1', 'gk2', null) as gk2_res, if(split(res1, '')[34]='1', 'gk35', null) as gk35_res from test.table_name where length(res1)=35 or res1='' ) t;

小讯
上一篇 2025-02-26 07:15
下一篇 2025-03-17 08:36

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/127738.html