朴素贝叶斯文本分类问题中概率如果相等是如何处理的?

from sklearn.naive_bayes import MultinomialNB
nb = MultinomialNB()
from sklearn.pipeline import make_pipeline
pipe = make_pipeline(vect, nb)
pipe.fit(X_train.cutted_comment, y_train)

pipe.predict(X_test.cutted_comment)

朴素贝叶斯是分别计算这个文本是差评的概率和是好评的概率,但是如果这两个概率相等该分到哪一类呢?我是基于词袋模型构建的特征词典,比如一个新的文本,文本中没有出现词典中的特征词,但是用拉普拉斯平滑可以算出一个不为零的概率,但是理论上应该好评差评概率相等吧,这个时候应该归在哪一类呢?实现机制是怎么样的?

1个回答

概率如果相等的话可以随机判断一个。

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问