新用户注册
备考刷题,请到
CDA认证小程序
孤立森林的核心直觉是:“异常点是疏离的(Isolated)”。 正常样本通常密集聚集,需要经过很多次随机切割才能将其与其他点分开(路径长);而异常点通常远离密集区域,可能只需要随机切一两刀(Root -> Split -> Leaf)就独立成为一个叶子节点(路径短)。因此,期望路径长度 E(h(x)) 越小,异常评分(Anomaly Score)越高。考察对特定树模型(非梯度提升类)决策路径物理含义的理解。