1. Job Roadmap
  2. Home
  3. Problem Set
  4. codenotelist
  5. Forum
  6. course
  7. Shore Share Sessions
  8. Record
  1. Login
  2. Sign Up
  3. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
    ZhContent TextSol AI分析

解题思路

这道题按照题意直接模拟即可,使用的算法是多项式朴素贝叶斯二分类。

已知:

  • train 中每一行最后一列是标签 y∈{0,1}
  • 前面的列是每个词的词频
  • test 中只有词频特征

P4597.第2题-朴素贝叶斯二分类器

    1000ms Tried: 184 Accepted: 24 Difficulty: 5 所属公司 : 美团
    算法与标签>机器学习算法

题目内容

请帮助小美实现一个朴素贝叶斯 (Multinomial(Multinomial(Multinomial NB)NB)NB) 二分类器,在给定训练集后对测试集输出标签。

小美设计的算法步骤如下:

1.输入读取

  • traintraintrain 字段:二维列表,每行最后一列 y∈y∈y∈{0,10,10,1},其余列为非负整数词频

  • testtesttest 字段:二维列表,仅含词频特征(维度与训练一致)

2.平滑:使用拉普拉斯平滑 k=1k=1k=1

P(w∣c)=nc,w+1∑w′(nc,w′+1)P(w \mid c)=\frac{n_{c, w}+1}{\sum_{w^{\prime}}\left(n_{c, w^{\prime}}+1\right)}P(w∣c)=∑w′​(nc,w′​+1)nc,w​+1​,nc,wn_{c,w}nc,w​ 表示在所有训练样本中标签为 ccc 时第 www 个词的总频次。

3.先验概率:πc=NcN\pi_{c}=\frac{N_{c}}{N}πc​=NNc​​,NcN_cNc​ 为类别 ccc 的样本数量,NNN 为总样本数。

4.对数后验:对样本 xxx 计算 log⁡P(c∣x)=log⁡πc+∑wxwlog⁡P(w∣c)\log P(c \mid x)=\log \pi_{c}+\sum_{w} x_{w} \log P(w \mid c)logP(c∣x)=logπc​+∑w​xw​logP(w∣c)

5.预测规则:若 logP(1∣x)≥logP(0∣x)logP(1|x)≥logP(0|x)logP(1∣x)≥logP(0∣x) 输出 111 ,否则 000 。

输入描述

{

"train": [[f11,...,f1m,y1],..., [fn1,...,fnm.yn]].

"test": [[t11,...,t1m],...,[tk1,...,tkm]]

}

行长度必须一致;train[i][:−1]train [i][:-1]train[i][:−1]与 test[j]test[j]test[j] 均为非负整数词频。

输出描述

所有测试样本的预测标签 (0/1)(0/1)(0/1) 按顺序放入 JSONJSONJSON 数组,例如:[0,1,0][0,1,0][0,1,0]

补充说明

为保证结果唯一可复现,所有随机过程必须:

importimportimport numpynumpynumpy asasas npnpnp

np.random.seed(42)np.random.seed(42)np.random.seed(42)

样例1

输入

{"train":[[2,0,0,0],[3,1,0,0],[0,0,2,1],[0,1,3,1]],"test":[1,0,0],[0,1,2]]}

输出

[0,1]

登录后即可使用 AI 分析。

模式
倒计时时长
:

最长 10 小时 59 分;应用后按此时长重新开始。

提示:点击提交记录在左侧题面区域查看详情
题库
AI分析设置
留空使用官方API Key,每天有次数限制(自定义API Key仅限会员和管理员使用,不限次数)
会员和管理员可切换模型;切到 Kimi/智谱/通义/豆包时需填写对应供应商 API Key
升级会员,可将运行与提交冷却时间缩短至 1 秒起

Status

  • Judging Queue
  • Service Status

Development

  • Open Source

Support

  • Help
  • Contact Us

About

  • About
  • Privacy
  • Terms of Service
  • Copyright Complaint
  1. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
  2. Legacy mode
  3. Theme
    1. Light
    2. Dark
  1. 京ICP备2025123107号-1
  2. Worker 1, 54ms
  3. Powered by Hydro v5.0.0-beta.18 Community
CLOSE


ScanQRCodePrompt

请使用微信扫描下方二维码完成注册

Forgot password or username?