list
(每一行中的最后一列为类别 label),我们可以直接用 eval(input())
将字符串转成 list
对象。某新零售食品连锁企业,利用先进的科技和数据分析来提供生鲜食品购物体验,决策树是一种机器学习算法,可以在不同场景中发挥作用,帮助优化业务决策和提高效率。信息熵是决策树中非常重要的一个概念,请根据输入描述和输出描述中的要求,编程实现信息熵的计算。
提示:计算某一数据集的信息熵,可以使用 H(D)=−∑k=1k∣D∣∣Ck∣log2∣D∣∣Ck∣,
其中 ∣Ck∣,代表的是属于某一类的样本个数,D 是整个数据集的样本数量,根据某一特征的不同取值可以将数据划分为 D1,D2...Dn ,故有 ∑i=1n∣Di∣=∣D∣ 。K 为别的类别的数目。