在进行计算句子相似度时,输出结果是这样的
但是我只想要里面计算出来的值 应该怎么改是这样计算的
结果很奇怪 应该怎么修改
在进行计算句子相似度时,输出结果是这样的
def replace_feature(data): # 把数据处理,字符串改成数字形式
for each in data.colums: # 遍历data中的每个feature
unique_value = set(feature_list) #剔除每个feature中重复的元素,接受参数为list # set输出值的顺序是随机,可能会产生
i = 0
for fea_value in unique_value: #遍历单个feature中的每个元素
data[each] = data[each].replace(fea_value,i) # 用数字重置之前每个feature中评判标准的字符串(字符串数值离散化)
# 例如school中的“GP”评判标准改为0
# school中的"MS"判断标准改为1
i += 1
return data
stu_data = replace_feature(stu_data)
stu_data.head()