1. Job Roadmap
  2. Home
  3. Problem Set
  4. codenotelist
  5. Forum
  6. course
  7. Shore Share Sessions
  8. Record
  1. Login
  2. Sign Up
  3. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
    ZhContent TextSol AI分析

思路

  • 概率计算: 对每个用户,先求每个类别的阅读次数占比 pi=ci∑jcjp_i = \frac{c_i}{\sum_j c_j}pi​=∑j​cj​ci​​。
  • 忽略零项: 若某类次数为 0,则该项 pilog⁡2pip_i \log_2 p_ipi​log2​pi​ 视为 0,不参与求和。
  • 信息熵: 按 H=−∑i=1npilog⁡2piH = -\sum_{i=1}^{n} p_i \log_2 p_iH=−∑i=1n​pi​log2​pi​ 计算,底为 2。

P3474.第2题-新闻推荐处理

    1000ms Tried: 53 Accepted: 8 Difficulty: 5 所属公司 : 阿里
    算法与标签>模拟

题目内容

你正在为一个新闻推荐系统工作,该系统根据用户的阅读历史和新闻的类别来推荐新闻。

给定一个用户的阅读历史数据,每个用户有多个新闻类别的阅读次数。

我们希望计算每个用户阅读新闻类别的信息熵。

信息熵的计算公式为:H=−∑i=1npilog2PiH=-\sum^n_{i=1}p_ilog_2P_iH=−∑i=1n​pi​log2​Pi​

其中,pip_ipi​ 是用户阅读第 iii 类新闻的概率,nnn 是新闻类别的数量。

你需要编写一个 Python 函数,该函数接受上述格式的输入数据,从终端读取输入,然后计算每个用户的信息熵,并将结果保留到 333 位小数并输出到终端。

输入描述

输入是一个字典,键是用户的 ididid (字符串),值是一个字典,包含多个键,分别代表用户的历史阅读的新闻类型。

输出描述

返回一个字典,格式与输入相同,但是输出每个用户的信息。注意输出的引号格式。

样例1

输入

{"user1":{"sports":10, "technology":20,"entertainment":30},"user2":{"sports":20,"technology":30,"entertainment":10},"user3":{"sports":30,"technology":10,"entertainment":20}}

输出

{"user1":{"entropy":1.459},"user2":{"entropy":1.459},"user3":{"entropy"1.459}}

登录后即可使用 AI 分析。

模式
倒计时时长
:

最长 10 小时 59 分;应用后按此时长重新开始。

提示:点击提交记录在左侧题面区域查看详情
题库
AI分析设置
留空使用官方API Key,每天有次数限制(自定义API Key仅限会员和管理员使用,不限次数)
会员和管理员可切换模型;切到 Kimi/智谱/通义/豆包时需填写对应供应商 API Key
升级会员,可将运行与提交冷却时间缩短至 1 秒起

Status

  • Judging Queue
  • Service Status

Development

  • Open Source

Support

  • Help
  • Contact Us

About

  • About
  • Privacy
  • Terms of Service
  • Copyright Complaint
  1. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
  2. Legacy mode
  3. Theme
    1. Light
    2. Dark
  1. 京ICP备2025123107号-1
  2. Worker 2, 52ms
  3. Powered by Hydro v5.0.0-beta.18 Community
CLOSE


ScanQRCodePrompt

请使用微信扫描下方二维码完成注册

Forgot password or username?