本文介绍 机器学习评价指标(准确率召回率)

机器学习评价指标(准确率召回率)

This article was original written by Jin Tian, welcome re-post, first come with https://jinfagang.github.io . but please keep this copyright info, thanks, any question could be asked via wechat: jintianiloveu

很多人,包括我自己在理解准确率和召回率的时候往往不够透彻,究其原因是被日常生活中的准确率所误导。要理解这两个指标,不妨忘却所有的尝试,从理性的角度来考虑下。

其实也很简单,我们说一个机器学习系统,比如说分类,你如何评价它的性能呢?比如,总共10个结果,其中8个正类,2个负类,你能说准确率是80%吗?这是错误的,这个比例并不能反映任何机器学习系统指标,为什么?它只是正负类的比率,无法反映系统能力.

那如何评价机器学习分类系统的能力呢?很简单,你需要根据Groundtruth来对比,真实值是这样的,有7个正类和3个负类。你看,7个正类里面,为什么我预测出来了8个?如果只看结果,你会发现,准确率是87.5% (7/8, 8个结果里面只有7个是正确的其中一个虽然是正类但是是错误的),这个其实就是非常朴实的正确率,也就是在结果里面,有多少是正确的。

我有点糊涂了,为什么准确率是结果里面预测为正的中真正为证的比率,而不是所有结果中,正确样本的比率?上面这个例子,到底是7/8 还是 910 (9包括正确的7个正,2个负,10是总体)呢?