考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

根据以下混淆矩阵和ROC曲线,回答以下两题: 图中E、F、G分别表示对应部分的面积 (1)ROC曲线的x轴,实际上可以由每个阈值下混淆矩阵的()计算而来
A. C/(B+C)
B. D/(A+D)
C. B/(B+C)
D. C/(C+D)
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

ROC曲线全称为受试者工作特征曲线 (Receiver Operating Characteristic Curve),这一名称来自于医学领域。ROC曲线源于军事领域,而后在医学领域应用甚广。 ROC 曲线以真阳性率(敏感性)为纵坐标,假阳性率(1-特异性)为横坐标,两者都可以 通过混淆矩阵计算得到。 下图是标准的混淆矩阵: ![](https://file.haoxueai.cn/haoxue/img/f21d48f4-0947-49c5-baf7-6dd2d1b10cf1.png) 其中符号解释如下: ![](https://file.haoxueai.cn/haoxue/img/8dee1941-fb75-4cef-b248-e2b3a31ff597.png) 题干中的混淆矩阵和上面标准混淆矩阵是一一对应的。假阳性率为健康人中被误诊为阳性的概率,即有,对应的题干中的符号就是,故选D

(1)ROC曲线的x轴表示的是假阳性率(False Positive Rate, FPR),它是由每个阈值下混淆矩阵的假阳性数(False Positive, FP)和真负数(True Negative, TN)计算而来的。假阳性率的公式是:

\[ \text{FPR} = \frac{\text{FP}}{\text{FP} + \text{TN}} \]

在混淆矩阵中:
- FP(False Positive)对应的是B。
- TN(True Negative)对应的是C。

根据以上公式,假阳性率(FPR)可以表示为:

\[ \text{FPR} = \frac{B}{B + C} \]

因此,正确答案是:

C: B/(B+C)

### 专业分析
ROC曲线(Receiver Operating Characteristic Curve)是用于评估二分类模型性能的图形工具。它通过绘制真阳性率(True Positive Rate, TPR)对假阳性率(False Positive Rate, FPR)的曲线来表示模型在不同阈值下的表现。

- **X轴(假阳性率,FPR)**:表示分类器将负类样本错误分类为正类样本的比例。公式为 \(\text{FPR} = \frac{\text{FP}}{\text{FP} + \text{TN}}\)。
- **Y轴(真阳性率,TPR)**:表示分类器将正类样本正确分类为正类样本的比例。公式为 \(\text{TPR} = \frac{\text{TP}}{\text{TP} + \text{FN}}\)。

通过调整阈值,可以观察到FPR和TPR的变化,从而评估模型的性能。理想情况下,好的分类器应当在保持较低FPR的情况下,尽可能提高TPR。