1. Job Roadmap
  2. Home
  3. Problem Set
  4. codenotelist
  5. Forum
  6. course
  7. Shore Share Sessions
  8. Record
  1. Login
  2. Sign Up
  3. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
    ZhContent TextSol video solution AI分析

思路

  • 关键:因为特征是一维且阈值只按大小划分,所以只需在相邻不同特征值之间、以及两端考虑切分点。重复特征值的样本不可被阈值拆分,需整组一起在同侧。

  • 做法:

    • 将样本按特征 xxx 升序排序。
    • 预处理前缀计数 prefL(i)\text{prefL}(i)prefL(i):排序后前 iii 个(含 iii)中标签等于 LLL 的数量。
    • 预处理后缀计数 sufR(i)\text{sufR}(i)sufR(i):排序后从 iii 到末尾中标签等于 RRR 的数量。
    • 只在每个“特征值分组的末尾”作为切分(记该位置为 iii)计算

P3528.第二题-阈值最优的决策树

    1000ms Tried: 1331 Accepted: 264 Difficulty: 3 所属公司 : 华为
    算法与标签>双指针

题目内容

决策树生成算法递归地产生决策树,直到不能继续下去为止,在这个过程中,最关键的是确定每个节点的阈值。一种传统方法是划分之后,需要使得数据集的熵减最大化。

而小明同学面对的问题是一个基座问题:只有一个特征的数据集的二分类问题。如果构建出二叉树,那么将形如:”一个根节点配两个儿子节点“的结构。

在这种问题下,小明希望通过一个更加简洁的策略来获得结果:枚举阈值,得到验证集上的最优的准确率。请问给定验证集,需要设定怎样的阈值使得准确率最大化。

请输出小AAA通过他提出的寻找阈值的策略,在验证集上可以达到的最优 准确率

输入描述

第一行一个整数M(1<=M<=105)M(1<=M<=10^5)M(1<=M<=105) 表示验证集条数

随后 MMM 行为验证集特征和 labellabellabel,每行 222 个整数,第一个数为该条数据的特征,最后一个整数为该条数据的 label∈[0,1]label \in [0,1]label∈[0,1] 。

随后一行两个整数L,RL,RL,R 分别代表左子树和右子数的labellabellabel , L≠R且L,R∈[0,1]L\neq R且L,R\in[0,1]L=R且L,R∈[0,1]

输出描述

第一行,一个浮点数,为验证集可达到的最优准确率,四舍五入保留小数点后 333 位。

样例1

输入

5
1 0
2 0
3 1
4 0
5 0
0 1

输出

0.800

说明

设定阈值=5=5=5 , 那么所有样本进入左子树,被归类为0 , 准确率为45=0.8\frac{4}{5}=0.854​=0.8 , 注意保留三位小数

样例2

输入

5
1 1
2 1
3 1
4 0
5 0
1 0

输出

1.000

说明

设定阈值=3=3=3 , 那么样本1,2,31,2,31,2,3进入左子树,被归类为1 , 样本4,5,64,5,64,5,6 进入右子树,被归类为000 , 全部分类正确,准确率为111

提示

本题准确率的计算方法为:预测正确的样本个数总样本个数本题准确率的计算方法为:\frac{预测正确的样本个数}{总样本个数}本题准确率的计算方法为:总样本个数预测正确的样本个数​

开通会员即可查看完整视频题解: 1.题目讲解 2.思路分析 3.逐行代码手写

登录后即可使用 AI 分析。

模式
倒计时时长
:

最长 10 小时 59 分;应用后按此时长重新开始。

提示:点击提交记录在左侧题面区域查看详情
题库
AI分析设置
留空使用官方API Key,每天有次数限制(自定义API Key仅限会员和管理员使用,不限次数)
会员和管理员可切换模型;切到 Kimi/智谱/通义/豆包时需填写对应供应商 API Key
升级会员,可将运行与提交冷却时间缩短至 1 秒起

Status

  • Judging Queue
  • Service Status

Development

  • Open Source

Support

  • Help
  • Contact Us

About

  • About
  • Privacy
  • Terms of Service
  • Copyright Complaint
  1. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
  2. Legacy mode
  3. Theme
    1. Light
    2. Dark
  1. 京ICP备2025123107号-1
  2. Worker 2, 48ms
  3. Powered by Hydro v5.0.0-beta.18 Community
CLOSE


ScanQRCodePrompt

请使用微信扫描下方二维码完成注册

Forgot password or username?