第二题-阈值最优的决策树 - problem_ide - CodeFun2000

访问过于频繁

您的访问过于频繁，请稍后再试。

会员专享

请先登录，登录后可使用今日免费解锁；开通会员，或购买该题目所属题库（华为校招机考题库），可解锁完整内容。

购买题库开通会员

思路

关键：因为特征是一维且阈值只按大小划分，所以只需在相邻不同特征值之间、以及两端考虑切分点。重复特征值的样本不可被阈值拆分，需整组一起在同侧。
做法：
- 将样本按特征 $x$ 升序排序。
- 预处理前缀计数 $\text{prefL}(i)$ ：排序后前 $i$ 个（含 $i$ ）中标签等于 $L$ 的数量。
- 预处理后缀计数 $\text{sufR}(i)$ ：排序后从 $i$ 到末尾中标签等于 $R$ 的数量。
- 只在每个“特征值分组的末尾”作为切分（记该位置为 $i$ ）计算

编辑器加载中…

输入

预期输出（选填）