1. Job Roadmap
  2. Home
  3. Problem Set
  4. codenotelist
  5. Forum
  6. course
  7. Shore Share Sessions
  8. Record
  1. Login
  2. Sign Up
  3. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
    ZhContent TextSol AI分析

解题步骤

  1. 读取数据:输入是一个 Python 格式的二维 list(每一行中的最后一列为类别 label),我们可以直接用 eval(input()) 将字符串转成 list 对象。
  2. 提取标签:遍历二维列表的最后一列,统计每个类别出现次数。

P3501.第2题-某新零售食品连锁企业的决策

    1000ms Tried: 11 Accepted: 9 Difficulty: 5 所属公司 : 阿里
    算法与标签>数学

题目内容

某新零售食品连锁企业,利用先进的科技和数据分析来提供生鲜食品购物体验,决策树是一种机器学习算法,可以在不同场景中发挥作用,帮助优化业务决策和提高效率。信息熵是决策树中非常重要的一个概念,请根据输入描述和输出描述中的要求,编程实现信息熵的计算。

提示:计算某一数据集的信息熵,可以使用 H(D)=−∑k=1kH(D)=-\sum^k_{k=1}H(D)=−∑k=1k​∣Ck∣∣D∣\frac{∣C_k∣}{∣D∣}∣D∣∣Ck​∣​log2log2log2∣Ck∣∣D∣\frac{∣C_k∣}{∣D∣}∣D∣∣Ck​∣​,

其中 ∣Ck∣∣C_k∣∣Ck​∣,代表的是属于某一类的样本个数,DDD 是整个数据集的样本数量,根据某一特征的不同取值可以将数据划分为 D1,D2...DnD_1,D_2...D_nD1​,D2​...Dn​ ,故有 ∑i=1n∣Di∣=∣D∣\sum^n_{i=1}∣D_i∣=∣D∣∑i=1n​∣Di​∣=∣D∣ 。KKK 为别的类别的数目。

输入描述

输入的数据集为一个二维 listlistlist ,该二维 listlistlist 中每一个子 listlistlist 的最后一个元素表示当前样本的 labellabellabel , labellabellabel 为 000 表示负样本,111 表示正样本,其余的元素表示特征的值,每一列都表示一个固定的特征,例如,第一列特征可以表示收入层级,第二列特征可以表示是否有车等,形如 [[0,1,0,0,′0′],[2,0,0,1,′1′]][[0,1,0,0,'0'],[2,0,0,1,'1']][[0,1,0,0,′0′],[2,0,0,1,′1′]]。为了方便区别,labellabellabel 以 StringStringString 的数据形式进行存储。

为了便于使用,所有案例都以单行的形式传入,因此形如sys.stdinsys.stdinsys.stdin 等方法结合 forforfor 循环和 evalevaleval 函数即可读取并还原数据。

输出描述

要求给出在既定数据集下,输出对应的信息熵的值,返回值结果为 floatfloatfloat 形式,保留小数点后 333 位有效数字。

补充说明

(1)请严格按照返回值的要求设置返回值的格式,保证返回值的唯一性。

(2)可以使用形如 numpynumpynumpy 和 pandaspandaspandas 等自带代码库。

(3)mathmathmath 库中含有 logloglog 计算方法。

样例1

输入

[[0,0,0,0,'0'],[0,0,0,1,'0'],[0,1,0,1,'1'],[0,1,1,0,'1'],[0,0,0,0,'0'], [1,0,0,0,'0']]

输出

0.918

说明

保留小数点后三位有效数字后,数据集下的信息熵为 0.9180.9180.918

登录后即可使用 AI 分析。

模式
倒计时时长
:

最长 10 小时 59 分;应用后按此时长重新开始。

提示:点击提交记录在左侧题面区域查看详情
题库
AI分析设置
留空使用官方API Key,每天有次数限制(自定义API Key仅限会员和管理员使用,不限次数)
会员和管理员可切换模型;切到 Kimi/智谱/通义/豆包时需填写对应供应商 API Key
升级会员,可将运行与提交冷却时间缩短至 1 秒起

Status

  • Judging Queue
  • Service Status

Development

  • Open Source

Support

  • Help
  • Contact Us

About

  • About
  • Privacy
  • Terms of Service
  • Copyright Complaint
  1. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
  2. Legacy mode
  3. Theme
    1. Light
    2. Dark
  1. 京ICP备2025123107号-1
  2. Worker 2, 47ms
  3. Powered by Hydro v5.0.0-beta.18 Community
CLOSE


ScanQRCodePrompt

请使用微信扫描下方二维码完成注册

Forgot password or username?