思路梳理

题目内容

在仅使用 $numpy$ / $pandas$ / $scikit-learn$ 的前提下，完成一个英文短文本情感二分类流程：

$1$ .数据清洗(统一大小写、去掉多余空字符)

$2$ .特征工程: $CountVectorizer(1-2 gram,min_df =1)$ → $TfidfTransformer$

$3$ .模型: $LogisticRegression$ ( $penalty$ =" $12$ ", $C=1.0$ , $solver$ =" $lbfgs$ ", max_iter= $500$ ,random_state= $42$ )

请从“运行结果”或“历史提交”选择一条记录

选择提交后开始分析