解题思路

这道题要求在只使用 $numpy$ 、 $pandas$ 的前提下，手写实现二分类的 $Logistic\ Regression$ ，并且训练方法固定为 $IRLS$ ，也就是迭代重加权最小二乘。

设训练集特征矩阵为 $X$ ，标签为 $y$ ，参数为 $w$ 。

为了表示截距项，需要先在特征矩阵最左侧拼接一列全 $1$ 。这样模型形式为：

P4755.第2题-小美的优惠券预测模型

1000ms

Difficulty: 5

所属公司 : 美团

算法与标签>机器学习算法

小美正在为美团的优惠券推荐业务开发一个预测模型，她需要使用对数几率回归（ $Logistic$ $Regression$ ）来预测用户是否会购买某个优惠券。请你帮助她，在仅使用 $numpy、pandas$ 的前提下，手写实现该模型并对测试样本给出类别预测。

具体流程

1.读取数据

$train$ ：二维列表，代表用户历史行为数据。最后一列为标签 $y∈$ { $0,1$ }（ $1$ 代表购买， $0$ 代表未购买），前 $m$ 列为用户的数值特征
test：二维列表，仅包含与训练集同维度的用户特征

2.模型训练（ $IRLS$ 闭式迭代）

3.预测

测试集同样拼接截距列
计算 $\hat{p}=\sigma\left(X_{\text {tast }} \hat{w}\right),$ ，取 $\hat{y}=1[\hat{p} \geq 0.5]$ 作为预测标签

标准输入仅一行 $JSON$ ，例如：

{
    "train": [[1,2,0],
           [2,1.8,0],
           [5,5,1],
           [4.5,2,1]],
    "test": [[1.5,1.9],
          [5.0,5.1]]
}

仅输出一行： $[0,1]$

为确保通过测试用例，仅允许使用 $Numpy$ 和 $Pandas$

输入

{"train": [[1,2,0],[2,1.8,0],[5,5,1],[4.5,5.2,1]],"test":[[1.5,1.9],[5,5.1]]}

输出

[0,1]

编辑器加载中…

输入

预期输出（选填）