input()
读取一行字符串;实现一个基于TF−IDF的文本相似度计算系统。具体要求如下:
1.读取输入的文本数据。
2.对文本数据进行预处理(例如分词、去停用词,大小写统一)。
3.使用TF−IDF方法提取文本特征。
4.计算每对文本之间的余弦相似度。
输入为一个维列表,包含若干英义义本数据。
输出为一个二维列表,表示每对文本之间的余弦相似度,保留两位小数,用字符串形式表示。
具体格式见输出样例。
输入
["l love this product","I LOVE this product","I love this ipad pro"]
输出
['1.00','1.00','0.24']
['1.00','1.00','0.24']
['0.24','0.24','1.00']
本题属于以下题库,请选择所需题库进行购买