机器学习——性能度量-Day2（续）

科技前沿 • 2025-02-14 12:19 • 阅读 59

大家好，我是讯享网，很高兴认识大家。

Day2讲到得PR图用于判定和比较学习器的性能，但单纯的通过概念性的比较和质性研究是无法很好的判断出通用方面某两个学习器的性能优劣的。因此人们设计了一些综合考虑查准率、查全率的性能度量。

“平衡点”（Break-Even Point,简称BEP）就是这样一个度量。它是“查准率=查全率”时的取值，例如途中学习器C的BEP是0.64，而基于BEP的比较，可认为学习器A优于B。这是一种度量方式。

但BEP还是过于简化了些，在真正筛选学习器性能时，目的明确的情况下很少要求查准率和查全率双高的情况（因为不太可能），因此在筛选时，更常用的是F1度量。N为样本总数。

$F1=\frac{2*P*R}{P+R}=\frac{2*TP}{N+TP-TN}$

！！！在一些应用中。例如在商品推荐系统中，为了尽可能少打扰用户，更希望推荐内容确是用户感兴趣的，此时，查准率更重要；而在逃犯信息检索系统中，更希望尽可能少漏掉逃犯，此时显然查全率更为重要。因此，我们需要推导出F1度量的更一般形式——F $\ss$ ，能让我们用一个式子来表达出对查准率/查全率的不同偏好。它定义为