ROC曲线全称为受试者工作特征曲线 (Receiver Operating Characteristic Curve),这一名称来自于医学领域。ROC曲线源于军事领域,而后在医学领域应用甚广。 ROC 曲线以真阳性率(敏感性)为纵坐标,假阳性率(1-特异性)为横坐标,两者都可以 通过混淆矩阵计算得到。下图是标准的混淆矩阵:

其中符号解释如下:

题干中的混淆矩阵和上面标准混淆矩阵是一一对应的。假阳性率为健康人中被误诊为阳性的概率,即有,对应的题干中的符号就是,故选D。
在回答问题之前,先简要解释一下ROC曲线和混淆矩阵的相关概念。
ROC(Receiver Operating Characteristic)曲线是一种用于评估二分类模型性能的工具。它通过不同阈值下的真阳性率(TPR,True Positive Rate)和假阳性率(FPR,False Positive Rate)来绘制曲线。
混淆矩阵是用于评价分类模型性能的工具,包含以下四个元素:
- TP(True Positive):真正例
- TN(True Negative):真反例
- FP(False Positive):假正例
- FN(False Negative):假反例
ROC曲线的x轴是FPR(False Positive Rate),其计算公式为:
\[ \text{FPR} = \frac{FP}{FP + TN} \]
根据混淆矩阵中的符号表示,假阳性数(FP)对应于选项中的B,真反例数(TN)对应于选项中的C。因此,FPR的计算公式可以写成:
\[ \text{FPR} = \frac{B}{B + C} \]
因此,正确答案是:
C: B/(B+C)
### 专业分析
在ROC曲线中,x轴表示假阳性率(FPR),即模型错误地将负类预测为正类的概率。这一指标反映了模型在不同阈值下的错误警报率。通过计算每个阈值下的FPR,我们可以绘制出ROC曲线的x轴。
在混淆矩阵中,假阳性(FP)表示被错误分类为正类的负样本数量,而真反例(TN)表示被正确分类为负类的样本数量。因此,假阳性率(FPR)可以通过假阳性数除以假阳性数和真反例数之和来计算,即:
\[ \text{FPR} = \frac{FP}{FP + TN} \]
在选项中,B代表FP,C代表TN,因此FPR的计算公式为:
\[ \frac{B}{B + C} \]
这解释了为何答案是选项C。